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Gemisch mindestens zweier Fusionsproteine sowie ihre Herstellung und Verwendung 

Die vorliegende Erfindung betrifft ein Proteingemisch, enthaltend mindestens ein erstes Fusi- 
5 onsprotein, enthaltend ein Protein oder Pioteinfiagment, eine Interaktionsdomane und eine 
Proteintranslokationssequenz, die bewirkt, dafi das Fusionsprotein bei Ejcpression in ein Bak- 
terium in einem im wesentUchen ungefalteten Zustand dutch die zytoplasmatische Membran 
transloziert wird, und mindestens ein zweites Fusionsprotein, enthaltend ein Protein oder Pro- 
teinfiagment, eine Interaktionsdomane und eine Proteintranslokationssequenz, die bewirkt, 
l^^daB das Fusionsprotein bei Expression in einem Bakteiium in einem im wesentUchen gefalte- 
^^Hen Zustand dutch die zytoplasmatische Membran transloziert wird, wobei die Interaktiotis- 
domSne des ersten Fusionsproteitis an die des zweiten Fusionsproteins binden kann. 

Die Phagendisplay-Technologie wird heutzutage in vielen Bereichen der Biotechnologie zum 
1 5 Auffinden von Proteinen mit gewunschten Bindungseigenschaften und enzymatischen Aktivi- 
taten verwendet (Forrer, P. et al. (1999) Current Opinion in Struct. Biol. 9:514-520 und Gao, 
C. et al. (2002) Proc. Natl. Acad. Sci. U.S.A. 99:12612-12616). GleichermaBen wird die 
Technologic verwendet, um beispielsweise die Bmdungseigenschaften, die enzymatischen 
Eigenschaften und/oder die thermodynamische StabilitSt von bereits bekannten oder durch die 
20 Phagendispplay-Technologie isolierten Proteine zu verbessem (Fotrer, P. et al. (1999) siehe 
oben). Die Grundlage flir die Phagendisplay-Technologie Uegt in der Beobachtung, daB be- 
Jtimmte sogenannte nicht-lytische Bakteriophagen Bakterien lediglich infimeren und die Pha- 
genpartikel nicht etwa durch Lyse des Bakteriums freisetzen, sondem die einzelnen Bestand- 
teile des Baktetiophagens durch das Zytoplasma ins Periplasma und letztendlich auf die Bak- 
25 terienzelloberflSche transportieren, wo dann der komplette Phage assembliert wird, der sich 
anschlieUend von der Bakterienzelle I6st Die Fusion eines interessierenden Proteins mit ei- 
nem Phagenhtlllprotein fiihrt daher zum Export dieses Proteins aus dem bakteriellen Zytop- 
lasma und der PrSsentation auf der Oberflache des Bakteriums. FOr die PrSsentation geeignete 
Phagenhtillproteine sind beispielsweise die aus dem M13-Phagemid stammenden pm, pVI, 
30 pVn, pVin und pK (Gao, C. et al. (2002) siehe oben). 




Der N-T«minus des Phagenhtlllproteins ist nach auBen gerichtet, so daB das fiisionierte Pro- 
tein N-tetminal vom PhagenhOllprotein angeordnet sein muB, datnit es auf der Phagenoberfla- 





Che prasentiert wird. Dies flihrt zu keinem Problem, wenn einzelne bereits bekannte Proteine 
mit einem der genannten Phagenhullproteinen fusioniert werden soUen, da flir diese Proteine 
START- und STOP-Codons bekannt sind. Es ftihrt jedoch dam zu Problemexi, wenn eine 
sogenannte Phagen-Bibliothek hergestellt werden soU, bei der die Phagenhtillpioteine mit 
einer cDNA-BibUothek fusioniert werden soUen. Das Problem Hegt daiin, daB die in cDNA- 
BibUotheken enthaltenden kodieienden NukleinsSuren in der Kegel translationelle STOP- 
Codons am 3'-Ende enthalten da durch die Poly(A^-Selektion der mRNA und durch das sich 
anschUefiende OUgo-(dT)-priming die resultierenden cDNAs immer die translationellen 
STOP-Codons entbalten. So Uegt bei Fusion einer 01igo-(dT)-geprimten cDNA 5' vom Pha- 
genhiUlprotein immer ein STOP-Codon zwischen der cDNA und dem Phagenhiillprotein. 
wodurch wiederum die Expression eines Fusionsproteins aus dem cDNA kodierten Protein 
und dem PhagenhiUIprotein verhindert wird. Daher wurde von Crameri, R. und Suter, M. 
1(1993) Gene 137:69-75 ein neuartiges Klonierungs- und Expressionssystem entwickelt, das 
darauf basiert, daB die InteraktionsdomSnen der beiden Oncoproteine cJun und cFos, die iiber 
ein Proteinmotiv von gleichmSfiig beabstandeten Leuzinresten dem sogenannten „Leuzin- 
Zipper" eine starke Wechselwirkung zwischen den beiden Proteinen ausbHden (Landschulz et 
al. (1988) Science 240:1759-64), genutet werden, urn das jeweUs separat exprimierte Phagen- 
hiUIprotein und das cDNA-kodierte Protein zu einem Heterodimer zu verbinden. Dazu wurde 
von einem LacZ-Promotor gesteuert, ein Fusionsprotein exprimiert, das am N-Terminus aus 
cJun und am C-Terminus aus einem PhagenhtUlprotein (pHI) bestand und ein zweites Fusi- 
onsprotein, das am N-Terminus aus cFos und am C-Terminus aus einer cDNA-Bank bestand, 
wobei auch dieses Protein durch einen zweiten LacZ-Promotor gesteuert wurde. Durch die 
Meraktion von cJun und cFos fiber die jeweiligen Leuzin-Zipper im Periplasma eines Bakte- 
lums wurde dadurch die PrSsentation von Protein bzw. Proteinfragmenten, die durch cDNAs 
kodiert sind auf filamentosen Phagen mdglich. 

Beim Einsatz der Phagendisplay-Technologie gibt es das weitere Problem, dafi die Assemb- 
lierung der Phagen und somit auch der Einbau der Fusionsproteine in die Phagenpartikel aus- 
schlieBUch im Periplasma stattfindet (Russel et al. (1997) Gene 192(l):23-32). Um die jewei- 
Ugen Fusionsproteine ins Periplasma der Bakterienzelle zu exportieren, muB demnach gege- 
benenfells gentechnisch eine Sec-Signalsequenz an das Fusionsprotein angefUgt werden. Die- 
se Signalsequenz bewirkt, daB die Fusionsproteine in einem im wesentlichen ungefalteten 
Zustand ins Periplasma transportiert werden. Eine betiSchtUche Anzahl von Proteinen kann 
jedoch nicht mittels des Sec-Transportwegs ins Periplasma gelangen, da sogenannte „Stop- 



Transfer"-Sequeiizen oder eine zu schnelle Faltung des Proteins, die bereits ins Zytopiasma 
erfolgt, einen Transport verhindem. „Stop-Transfer"-Sequen2en bewirken durch eine lokale 
Haufung positiv-geladener Aminosauren in der Proteinsequenz, dafi das entsprechende Prote- 
in bei der Translokation fiber den Sec-Transportweg in der inneren Membtan stecken bleibt 
Proteine, die durch ihre schnelle und/oder stabile Faltung nicht mehr in der entfalteten Form 
von den Proteinen des Sec-Transportweges - insbesondere von SecB - gebunden werden 
kannen, werden nicht zum Sec-Tranlokase-Komplex ttansportiert und verbleiben im Cy- 
toplasma (Yamane et al. (1988) J. Bio. Chem. 263:19690-19696 und Berks, B. C. (1996) Mol. 
Microbiol. 22:393-404 und Bergs, B. C. et al. (2000) Mol. Microbiol. 35:260-274). Proteine, 
die auf reduzierende Bedingungen oder die fur ihre FunktionsMdgkeit auf zytoplasmatische 
Co-Faktoren, wie beispielsweise FeS-Zentren oder Molybdopterin angewiesen sind, kOnnen 

. ebenfalls nicht uber den Sec-Transportweg in funktioneller Form ins Periplasma gelangen. 

f Aufgrund der Inkompatibilitat mit dem Sec-Transportweg kSnnen demnach viele Polypeptide 
nicht funktionell gefaltet mit dem Phagendisplay prasentiert und anschlieBend selektiert wer- 
den. Die Translokation der Fusionsproteine tiber den Sec-Transportweg ins Periplasma stellt 
daher einen wesentlichen Nachteil der im Stand der Technik bekannten Phagendisplay- 
Techniken dai. 

Aus den unterschiedlichen Anforderung an das zelluiare Milieu bei Faltung bestimmter Prote- 
ine ergibt sich em weiteres Problem bei der E3q)ression von Fusionsproteinen insbesondere in 
Bakterien, wenn der eine Teil des Fusionsproteins nur im Periplasma eine korrekte Faltung 
annimmt, wie das z.B. bei Antik6rperproteinen der Fall ist (Gao, C. et al. (2002) siehe oben) 

I und der andere Teil des Fusionsproteins nur im Zytopiasma korrekt gefaltet werden kann, wie 
^as Z.B. beim grtin-floreszierenden Protein (GFP) der FaU ist, das Sec-inkompatibel ist. So ist 
Z.B. die Expression von Antik6rper-GFP-Fusionsprotein, d.h. von Fluoreszenz-markierten 
Antikfirpermolekalen, in Bakterien bisher nicht m5glich. Die BeschrSnkung auf den Sec- 
Transportweg verhindert somit die HersteUung einer Vielzahl interessanter Proteinkonjugate 
insbesondere in Bakterien. 

Bine Aufgabe der vorliegenden Erfindung besteht daher darin die Einschrankung der im Stand 
der Technik bekannten Phagendisplay-Technologie auszuraumen und die HersteUung von 
Fusionsproteinen zu ermOglichen, die bei HersteUung durch die im Stand der Technik be- 
kannten Verfahren nicht zu funktioneUen Fusionsproteinen ftihren. 



Die vorliegende Erfindung steUt daher ia einem Aspekt ein Proteingemisch zur Verfttgung, 
enthaltend: a) mindestens ein erstes Fusionsprotein, enthaltend; i) ein Protein oder Protein- 
fragment, ii) eine InteraktionsdomSne und iii) eine Pioteintranslokationssequenz, die bewirkt, 
daB das Fusionsprotein bei Expression in einem Bakterium in einem im wesentUchen ungefal- 
teten Zustand durch die zytoplasmatische Membran transloziert wird, mid b) mindestens ein 
zweites Fusionsprotein. enthaltend: i) ein Protein oder Proteinfiagment, ii) eine Interaktions- 
domane und iii) eine Proteintranslokationssequenz, die bewirkt, daB das Fusionsprotein bei 
Expression in einem Bakterium in einem im wesentUchen gefalteten Zustand durch die zy- 
toplasmatische Membran transloziert wird, wobei die hiteraktionsdomane des ersten Fusions- 
proteins an die des zweiten Fusionsproteins binden kann. 




Das Protein oder Proteinfragment des ersten Fusionsproteins umfaBt vorzugsweise Proteine, 
ie im ungefalteten Zustand durch die zytoplasmatische Membran eines Bakteriums, vor- 
zugsweise eines Gram-negativen Bakteriums transloziert werden kSnnen und die .demnach 
nicht fur ihre korrekte Faltung auf das reduzierende zytoplasmatische MiUeu und/oder auf 
zytoplasmatische Co-Faktoren angewiesen sind und die auch im Periplasma eine im wesentU- 
chen korrekte Faltung erreichen kSmien. Beispiele solcher Proteine umfassen, sind aber nicht 
limitiert auf schwere Immunoglobulinketten, leichte hnmunoglobuhnketten, Fragmente dieser 
Ketten, sogenannte „Single-Chain-Antik8rper« (Bud, R. E. (1988)Science 242:423-6), Dia- 
bodies (HoUiger, P. (1993) Proc. Natl. Acad. Sci. U.S.A 90(14):6444-8, Rezeptoren, vor- 
zugsweise extrazellulare DomSnen von Rezeptoren, wie beispielsweise, EGFR, PDGFR oder 
VEGFR, Oder Rezeptorliganden, wie beispielsweise EGF, PDGF oder VEGF, Integrine, vor- 
zugsweise deren extrazellulare Domanen, hitimine und deren Domanen, wie beispielsweise 
;aeA, Kohlenhydrat-bindende Proteine und Domanen davon, wie MBP und CBD, Albumin- 
bindende Proteine und DomSnen oder Protein A und dessen DomSnen. 

Das Protein oder Proteinfragment des zweiten Fusionsproteins kann ein beUebiges Protein 
Oder Proteinfiagment sein, bevorzugt sind jedoch Protemfragmente, die ihre Faltung und/oder 
ihre Funktion nur dann erhalten, wenn sie sich bereits im Zytoplasma ernes Bakteriums falten 
und daher in einen im wesentUchen gefalteten Zustand durch die zytoplasmatische Membran 
in das Periplasma transloziert werden. Beispiele solcher Proteine sind autofluoreszierende 
Proteine, wie beispielsweise GFP oder Varianten davon mit verSnderten Absorptionsmaxima, 
Enzyme, wie beispielsweise p-Lactamase, Cofaktor-abMngige Proteine, wie beispielsweise 
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TMAO-Reduktase und Meerrettich-Peroxidase, Proteine, die von einer cDNA kodiert werden, 
welche axis einer cDNA-Bibliothek stammt, oder synttietische Proteine. 

In einer bevorzugten Ausflanrungsform ist das Protein oder Proteinfragment des ersten Fusi- 
5 onsproteins und die Proteintranslokationssequenz ein PhagenhtUlprotein oder ein peripiasma- 
tisches Markerenzym, wie PhoA, ein Intimin ein Protein der SuBeren Bakteriemnembran oder 
ein periplasmatisches Rezeptorprotein, insbesondere ein Kohlenhydrat-bindendes Protein. 
Bevorzugte Phagenhullproteine, die in einem Proteingemisch der vorliegenden Erfindung 
enthalten sein kSnnen, sind ausgewahlt aus den M13-Phagemid Hiillproteinen pin, pVI, pVII, 
10 pVni und pDC. Von diesen PhagenhOllproteinen sind jedoch nur pHI und pVm mit einer be- 
kannten Sec-abhSngigen Proteintranslokationssequenz versehen, wobei die in den restlichen 

•Phagenhiillproteinen enthaltenden Proteintranslokationssequenzen noch nicht identifiziert 
Worden sind. Da diese PhagenhOllprotein dennoch in einem im wesentlichen ungefalteten 
Zustand in das Periplasma des Bakteriums transportiert werden, werden solche Proteine im 
15 Sinnde der Erfindung auch ohne Identifikation der Proteintranslokationssequenz als Proteine 
angesehen, die aus einem Protein oder Proteinfi:agment und einer Proteintranslokationsse- 
quenzen bestehen. 

Die InteraktionsdomSnen, die in dem ersten und zweiten Fusionsprotein verwendet werden, 
20 flihren zur Bindung des eisten Fusionsproteins an das zweite Fusionsprotein. Bevorzugt sind 
hierbei InteraktionsdomSnen, die zu einer relativ festen Interaktion der beiden Proteine fUh- 
ren, wobei eine relativ feste Interaktion eine Interaktion ist, die auch im oxidativen Milieu des 

•Periplasmas, auf der Bakterienzelloberflache oder bei des Sezemierung des Heterodimers 
^der Heteromultimers auch auBerhalb der Zelle bestehen bleibt. Geeignete Interaktionsdoma- 
25 nen des ersten und zweiten Fusionsproteins, die erfindungsgemaB in den Fusionsproteinen 
enthalten sein konnen, sind beispielsweise eine Leuzin-Zipper-DomSne imd eine Leuzin- 
Zipper-DomSne, wie sie zuerst in den zwei Qncoproteinen cJun und cFos beschrieben wurden 
(Landschulz et al. (1988) siehe oben) Varianten davon aus anderen Hetero- oder Homodime- 
ren sowie artifizielle Leuzin-Zipper-DomSnen oder eine Helix-Loop-Helix-DomSne und eine 
30 HeUx-Loop-Helix-DomSne (Moor et al, (1989) CeU 56:777-783), ein Cahnodulin und ein 
Cahnodulin-bindendes Peptid (Montigiani, S. et al. (1996) JMB 258:6-13) oder jeweils em 
Peptid eines Peptid-Dimers. Der Begriff Interaktionsdomanen umfaBt auch DomSnen die eine 
Multimerisierung von mehr als zwei Fusionsproteinen erlauben. 
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Die Proteintranslokationssequenz des ersten Fusionsproteins bewirkt, daB das Fusionsprotein 
bei Expression in einem Bakterium, vorzugsweise in einem Gram-negativen Bakterium in 
einem im wesentUchen ungefalteten Zustand dutch die zytoplasmatische Membian in das Pe- 
riplasma transloziert wird. Der Fachmann ist ohne weiteres in der Lage. entsprechende Prote- 
intranslokationssequenzen aufeufinden, wobei er sich des folgenden Experiments bedienen 
kann. Eine potentielle als Proteintranslokationssequenz geeignete Proteinsequenz. die zur 
Translokation eines damit fosionierten Proteins in einem im wesentlichen ungefalteten Zu- 
stand fiihrt, wird mit einem ein GFP-myc-TAG enthaltenden Protein fusioniert. Wenn die 
potentieUe Proteintranslokationssequenz nicht zur Proteintranslokation ins Periplasma flihrt, 
wird das GFP-Protein im Zytoplasma des Bakteriums gebildet, was sich tiber die zytoplasma- 
tische Fluoreszenz nachweisen lafit, es gelangt dann jedoch nicht an die OberflSche oder ins 
Medium, so daB der Myc-TAG durch einen anti-Myc-Antikorper bspw. den monoklonalen 
lAntikSrper 9E10 weder im Medium noch auf der Oberflache nachweisbar ist Fiihrt die Se- 
quenz jedoch zur Translokation des Fusionsproteins ins Periplasma und schUeBUch zur PrS- 
sentation auf der Oberflache bzw. zur Sezemierung in die Umgebmig des Bakteriums. so .laBt 
sich das prasentierte bzw. sezemierte GFP-myc-TAG-Fusionsprotem durch einen Anti-myc- 
AntikSiper im Medimn und/oder auf der Oberflache des Bakteriums nachweisen. Gleichzeitig 
soUte im Periplasma in diesem Fall keine Fluoreszenz beobachtet werden kOnnen, da bei 
Translokation des GFPs ins Periplasma in einem un wesentUchen ungefalteten Zustand sich 
das Protein dort nicht mehr korxekt faltet (sogenannte ..Seclnkompatibilitat"). Die Prote- 
intranslokationssequenzen die bevorzugt im ersten Fusionsprotein verwendet werden sind 
solche, die in dem Sec-abhangigen Transportweg (Danese, P. N. und Silhavy, T. J. (1998) 

IAnnu. Rev. Genet. 32:59-94), die in dem SRP-abhangigen Transportweg (Meylr, D. I. et al. 
^982) Nature 297:647-650) oder die in einem YidC-abhangigen Transportweg erkannt wer- 
den (Samuelson, J. C. et al. (2000) Nature 406:637-641). Allerdings kann es sich auch.um 
eine Transportweg-unabhSngige Sequenz handehL Besonders geeignete Proteintranslokati- 
onssequenzen sind daher beispielsweise Signalsequenzen des PhoA, PelB, OmpA und pin. 



Als weiterer Bestandteil enthalt das zweite Fusionsprotem eine Proteintranslokationssequenz, 
die bewirkt, dafi das Fusionsprotein bei Expression in einem Bakterium, vorzugsweise in ei- 
nem Gram-negativen Bakterium, in einem im wesentUchen gefalteten Zustand durch die zy- 
toplasmatische Membran transloziert wird. Eine Proteintranslokationssequenz mit dieser Ei- 
genschafl Uegt dann vor, wenn ein Protein, beispielsweise GFP, das nur im Zytoplasma des 
Bakteriums seine funktioneUe Konformation einnehmen kann, ohne Verlust der Autoflures- 
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zenz ins Periplasma transportiert wird. Diese Eigenschafl der erfindungsgemSBen Prote- 
intranslokationssequenz la/Jt sich mit dem vorangehend im HinbUck auf die erste Prote- 
intranslokationssequenz beschriebenen Experiment, untersuchen. Mit einem ahnUchen Expe- 
riment wurde bereits ein Konsensusmotiv ftir das Tat-spezifische Fiihrungspeptid des Twin- 
Argenine-Translokation-(Tat).Tiansportwegs von Bakterien und Pflanzenchloroplasten ennit- 
telt. Der im Stand der Technik bekannte Tat-Transportweg erlaubt den Transport von bereits 
im Zytoplasma gefalteten Pioteinen ins Periplasma und kann somit Proteine, die mit dem Sec 
Transportweg inkomatibel sind, ins Periplasma transportieien. Genau wie der Transport fiber 
den Sec-Transportweg. wird auch der Tat-Transprotweg durch eine spezielle Gruppe von 
Fflhrmigssequenzen vermittelt (DeLisa, M. P. et al. (2002) J. Biol. Chem. 277:29825-29831). 
Ein weiterer im Stand der Technik bekamiter Transportweg, der den Transport von Proteinen 
m im wesentUchen gefalteten Zustand erlaubt, ist der fiber Thylakoid-Membranen (Settles, A. 
Im. und Martienssen, R. (1998) Transcell Biol. 8:494-501). Daher enthSlt das zweite Fusions- 
protein in einer bevorzugten Ausffihrungsfoim der vorUegenden Erfindung eine Signalse- 
quenz, die von einem Tat-abhSngigen Transportweg oder von einem Thylakoid-Aph- 
abhangigen Transportweg erkamit wird und dadurch zur Translokation des Fusionsproteins in 
im wesentUchen gefalteten Zustand fthrt. Ein Konsensusmotiv einer Proteintranslokationsse- 
quenz, das von einem Tat-abhSngigen Transportweg erkannt wird. ist in DeLisa, M. P. et al. 
((2002) siehe oben) beschrieben worden. Die Sequenz lautet: S/T/RRXFLK. 

In einer bevorzugten Ausfiihrungsform des erfindungsgemSlJen Proteingemisches sind min- 
destens ein erstes mid mindestens ein zweites Fusionsprotein aneinander kovalent oder nicht- 
kovalent gebunden. Zur Eireichung einer kovalenten Bindung der zwei getremit exprimierten 
^usionsproteine kSmien beispielsweise in dem Protein zusStzlich nahe der Interaktionsdoma- 
ne Cysteinreste oder Homologe davon angeordnet werden, die im oxidativen MiHeu des Pe- 
riplasmas eine kovalente Bindung zwischen den beiden Fusionsproteinen herstellen. Eine ko- 
valente Bindung kami jedoch beispielsweise auch durch die Inkorpomtion von AminosEuren 
mit Foto-aktivierbaren Gruppen in die beiden Fusionsproteine mid anschlieJJende UV- 
Exposition der zmiSchst ledigUch nicht-kovalent aneinander gebmidenen Protein eneicht 
werden. Dem Fachmami sind weitei« Verfahien bekannt. mn zwei zunfichst allein durch 
nicht-kovalente Bindmig verbmidene Pioteine miteinander zu verbinden. Zu diesem dem 
Fachmami bekamiten Verfahren der kovalenten Verbindmig zweier nicht-kovalent- 
gebundener Fusionsproteine zShlt beispielsweise das Psoralen-Crosslinking. 



Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Nukleinsauregemisch, das flSr ein 
erfindungsgemaBes Proteingemisch kodiert. Eine kodierende Nukleinsaure, im Sinne der Er- 
findung ist ein Nukleinsauresequenz, die flir ein erfindungsgemaBes Polypeptid oder einen 
Vorlaufer davon kodiert. Bevoizugterweise handelt es sich bei dem Nukleinsauregemisch um 
DNA Oder RNA, voizugsweise um eine DNA, wobei die DNA einzelstiSngig oder dop- 
pelstrangig vorUegen kann. Die jeweUs ftir das erste oder zweite Fusionsprotein kodierende 
Nukleinsaure enthalt des weiteren Promotoren, die die Expression des jeweiligen Fusionspro- 
teins in der Wirtszelle ermSglichen. Geeignete Promotoren fiir die Expression in beispielswei- 
se E. coli sind der tip-Promotor, lacZ-Promotor, tet-Promotor, T7-Promotor oder ara- 
Promotor. Weitere Elemente, die in den jeweiligen, das Nukleinsauregemisch ausmachenden 
Nukleinsauren vorhanden sein konnen, sind Replikationsurspriinge (Ori), selektive Markerge- 
ne, die beispielsweise Ampizilin- oder Chloramphenikolresistenz vemiittehi. Die Nukleinsau- 
•en kennen neben dem fur das jeweilige Fusionsprotein kodierenden Bereich, die libUcher- 
weise in bakteriellen Expressionsvektoren verwendeten Elemente aufweisen. Dem Fachmann 
sind eine Vielzahl solcher Elemente sowie Vektoren bekannt, wie beispielsweise pGEM oder 
pUC. 




In einer bevorzugten Ausflihrungsformen des Nuklemsauregemisches der vorliegenden Erfin- 
dung, sind die zwei Nuklemsauren, die ftir das erste und zweite Fusionsprotein kodieren, ko- 
valent miteinander verbunden, vorzugsweise iiber Phosphordiester-Bindungen. hisbesondere 
smd die NukleinsauremolektUe, die far das erste und zweite Fusionsprotein kodieren und ge- 
eignete regulatorische Elemente enthalten, auf einem Plasmid enthalten, so daB die erfin- 
dungsgemaBen Protemgemische bereits durch Transfektion nur eines Plasmids bzw. wenn 
liese Nukleinsaure in einem Phagen enthalten ist, durch Infektion mit nur einem Phagen bei- 
spielsweise in einem Bakterium hergesteUt werdeu kSnnen. In einer bevorzugten AusfUh- 
rungsform werden beide Fusionsprotein unter der Kontrolle nur eines Promotors als bicistro- 
nische Kassette exprimiert. 



Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Vektor, enthaltend ein erfin- 
dungsgemaBes Proteingemisch und/oder enthaltend em erfindungsgemaBes Nukleinsaurege- 
misch. Ein Vektor, un Same der vorUegenden Erfindung, ist em Protein- 
Nukleinsauregemisch, das m der Lage ist, die in ihm enthaltenen Proteingemische und/oder 
Nukleinsauregemisch m eine Zelle emzuftihren. Dabei ist es bevorzugt, daB dabei die von den 
Nuklemsauregemischen kodierten Fusionsproteine in der ZeUe zur Expression kommen und 



somit de novo synthetisierte Fusionsproteine aus der ZeUe gewonnen, bzw. auf der ZeUober- 
flache prSsentiert werden. Geeignete Vektoren sind beispielsweise nicht-lytische Phagen, wie 
M13-Phage, fd-Phage, Fl-Phage und lytische Phagen, wie X-Phage. 



Ein weiterer Gegenstand der vorUegenden Erfindung, ist eine Zelle, enthaltend ein erfin- 
dungsgemfiBes Proteingemisch, ein erfindungsgemSBes Nukleinsauregemisch und/oder einen 
erfindungsgemafien Vektor. ErfindungsgemSBe Zellen kSnnen prokaryontische oder eukary- 
ontische Zellen sein. In einer bevorzugten AusfUImingsfonn der vorliegenden Erfindxmg, 
handelt es sich bei den erfindungsgemafien Zellen urn prokaryontische Zellen, insbesondere 
um Bakterien und noch bevorzugter urn E. coli (TGI, XL-1, JM83, BL21) oder B. subtilis. 



Bin weiterer Gegenstand der vorliegenden Erfindung ist eine Bibliothek, enthaltend mindes- 
tens zwei erfindungsgemafie Proteingemische, mindestens zwei erfindungsgemSBe Vektoren 
und/oder mindestens zwei erfindungsgemafie ZeUen, wobei die Proteine oder Proteinfiagmen- 
te der jeweiUgen ersten oder jeweiUgen zweiten Fusionsproteine voneinander unterschiedlich 
sind. Eine solche Bibliothek kann entweder gezielt ausgewahlte unterschiedUche bekannte 
Proteme oder Proteinfiragmente enthalten oder die Interaktionsdomane und die Proteintranslo- 
kationssequenz des ersten oder zweiten bevorzugt des zweiten Fusionsproteins kOnnen mit 
einer cDNA-Bibliothek fiisioniert werden, wobei bei Expression dieser Nukleinsauren eine 
Vielzahl unterschiedlicher erster oder zweiter Fusionsproteine entstehen, die jeweils unter- 
schiedliche Proteine oder Proteinfi-agmente enthalten. Vorzugsweise wird dabei der cDNA- 
Anteil am C-Terminus des Fusionsproteins exprimiert, um dadurch das vorangehend geschil- 
derte Problem bei N-terminaler Fusion einer cDNA zu umgehen. In einer bevorzugten Aus- 
igsform enthalt die Bibliothek eine Vielzahl von erfindungsgemafien Zellen, wobei jede 
ZeUe ein anderes Proteingemisch herstellt, vorzugsweise auf ihrer Oberflache prasentiert. Im 
Falle, dafi das Protein oder Proteinfiagment und die Interaktionsdomane des ersten Proteins 
ein PhagenhiiUprotein ist, erlaubt die erfindungsgemafie BibUothek die Prasentation einer 
Vielzahl von Proteinen oder Protemfiragmenten, die im zweiten Fusionspiotein enthalten sind. 
Dabei ist die Prasentation nicht wie bei den im Stand der Technik bekannten Phagendisplay- 
BibUotheken auf Proteine oder Proteinfiagmente beschrankt, die sich im Periplasma der Zelle 
zu ihier fiinktionellen Form falten, sondem umfafit auch Proteine, die nur im Zytoplasma ihre 
funktionelle Faltung erlangen kdnnen. 



derte F 
jhruni 
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Die erfindungsgemSBen Proteingemische, die Heterodimere oder Multimere bilden kSmien, 
wobei die Bestandteile der Heterodimere oder Multimere in mindestens zwei unterschiedli- 
chen zellularen Kompartments ihre dreidimensionale Struktur erhalten haben, lassen sich 
numnehr in einer Reihe von Verfahren xmter anderem auch im Phagendisplay einsetzen. 

5 

Ein weiterer Gegenstand der Erfindung ist daher ein Verfehren zum AufSnden von Substan- 
zen, die an ein Proteingemisch, einen erfindungsgemSBen Vektor oder an eine erfindungsge- 
mSfie Zelle binden, enthaltend die Schritte: 

a) In-Kontaktbringen mindestens einer potentiell-bindenden Substanz mit einem erfm- 
10 dungsgemSfien Proteingemisch, einem erfindungsgemaBen Vektor oder einer erfin- 

dimgsgemaBen Zelle vmd 

J)) Messen der Bindung der Substanz an das Proteingemisch, den Vektor und/oder die 
Zelle. 




1 5 Das Verfahren dient somit voizugsweise dem AufiSnden einer Substanz oder von Substanzen, 
die an ein bereits bekanntes Proteintarget binden, beispielsweise urn Inhibitoren, Aktivatoren, 
Kompetitoren oder Modulatoren des bekannten Proteintargets aufzufinden. Die potentieU bin- 
denden Substanzen deren Bindung an ein erfindungsgemSBes Proteingemisch, einen erfin- 
dungsgemaBen Vektor und/oder eine erjSndungsgemaBe Zelle gemessen werden soil, kann 
20 jede beliebige chemische Substanz oder jedes beliebige Substanzgemisch sein. Beispielsweise 
kann es sich hierbei um Substanzen emer Peptid-Bibliothek handeln, um Substanzen aus einer 
kombinatorischen chemischen Bibliothek, um Zellextrakte, insbesondere Pflanzenzellextrak- 
Ae, und lun Proteine oder Proteinfiragmente. 




25 Unter In-Kontaktbringen der potentieU bindenden Substanz(en) mit einem erfindungsgema- 
Ben Proteingemisch, Vektor oder Zelle wird jede MfigUchkeit der Wechselwirkung zwischen 
den beiden Komponenten verstanden, wobei sich die beiden Komponenten jeweils unabhSn- 
gig voneinander in fltissiger Phase, beispielsweise in Lfisung oder in einer Suspension, befin- 
den kennen oder auch an eine feste Phase, beispielsweise in Form einer im wesentUchen pla- 

30 naren OberflSche oder in Form von Partikehi, Perlen oder ahnlichem, gebunden sein k6mien. 
In einer bevorzugten Ausfiihrungsform ist eine Vielzahl unterschiedUcher potentieU binden- 
der Substanzen an einer festen Oberflache immobiUsiert und wird mit den erfindungsgemaBen 
Proteingemisch, dem erfindungsgemaBen Vektor oder der erfindungsgemaBen ZeUe In- 
Kontakt gebracht und anschlieBend wird die Bindung der erfindungsgemaBen Substanzen an 



den verschiedenen Positionen, an denen jeweils unterschiedliche potentieU-bindende Substan- 
zen inunobilisiert sind, gemessen. 





Das Messen der Bindung des erfindungsgemSfien Pioteingemisches, des Vektors oder der 
ZeUe. an eine potentieU bindende Substanz kann beispielsweise tlber die Messnng eines mit 
dem eifindimgsgemaBen Proteingemisch, mit dem eifindungsgemaBen Vektor oder der erfln- 
dungsgemaBen ZeUe verbundenen Markers geschehen, wobei geeignete Marker dem Fach- 
mann bekannt sind und beispielsweise Fluoreszenz- oder radioaktive Marker umfassen. In 
einer bevorzugten Ausftihrungsform enthait das Proteingemisch, der Vektor oder die Zelle 
zusatzKch im zweiten Fusionsprotein neben dem Protein oder Proteinfragment, dessen Wech- 
selwirkung mit den potentiell-bindenden Substanzen untersucht werden soU, ein autofluore- 
zierendes Protein, wie beispielsweise GFP oder Varianlen davon. Das Messen der Bindung 
fder Substanz kann jedoch auch ilber die Anderung von elektrochemischen. insbesondere Re- 
doxeigenschaften beispielsweise der immobilisierten potentiell bindenden Substanzen nach 
In-Kontaktbringen gemessbn werden. Geeignete Verfahren umfassen beispielsweise poten- 
tiometrische Methoden. Weitere Verfehren zum Nachweis der Bindung zweier Molekttle oder 
MolekWgemische, sind dem Fachmann bekannt und kSnnen gleichennaBen zum Messen der 
Bindung der potentieU-bindenden Substanz an das eifindungsgemSBe Proteingemisch, den 
erfindungsgemaBen Vektor oder die erfindungsgemSBe Zelle verwendet werden. 

GegebenenfaUs kdnnen vor, zwischen oder nach den Schritten des erfindungsgemaj3en Ver- 
fahrens weitere Schritte eingefiihrt werden, wie beispielsweise das ein- oder mehrmaUge Wa- 
schen nach dem In-Kontaktbringen, um beispielsweise unspezifische Bindungen zwischen der 
potentiell bindenden Substanz und dem erfindungsgemaBen Proteingemisch, dem erfindungs- 
gemaBen Vektor oder der erfindungsgemaBen Zelle zu l6sen. 

Als weitere Schritte nach dem Messen der Bindung der Substanz kann eine bindende Sub- 
stanz z,B. auf Grund der gemessenen BindungsstSrke ausgewahlt werden und dann direkt 
bspw. zur Inhibition des bekannten Proteintargets verwendet werden. Die bindende Substanz 
kann jedoch auch durch im Stand der Technik bekannte Verfahren, die auch Verfahren der 
kombinatorischen Chemie umfessen modifiziert werden. Beispielsweise durch das AnfUgen 
von Halogenseitengruppen, voi^sweise F oder CI. durch das Anfugen von nieder Al- 
kylgruppen, wie Methyl-, Ethyl-, n-Propyl-, iso-Propyl-, n-Butyl-, iso-Butyl- oder tert- 
Butylgruppen oder durch das Anfiigen von Amino-, Nitro-, Hydroxyl-, Amido- oder Carbon- 
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sauregruppen. Die so unterschiedUch modifizierten bindenden Substanzen kSnnen daim er- 
neut in dem erfindungsgemSBen Verfahren auf ihre Bindung getestet werden und hinsichtUch 
der gewiinschten Bindungsspezifitat und dem dadurch erzielten Effekt (beispielsweise Akti- 
vierung, Inhibierung oder Modulation der jeweiUgen Aktivitat) optimiert werden. 

Ein weiterer Gegenstand der vorUegenden Eifindung ist ein Verfahren zum Auffinden von 
Proteinen oder Proteinfragmeiiten. die an eine Testsubstanz binden, enthaltend die Schritte: 

a) In-Kontaktbringen mindestens einer Testsubstanz mit einer erfindungsgemSBen BibUo- 
thek und 

b) Messen der jeweiUgen Bindung der Testsubstanz an die unterschiedlichen Proteingemi- 
sche, Vektoren und/oder Zellen der erfindungsgemSBen BibUothek. 



15 



20 




25 



ei diesem Verfahren sollen Proteine oder Proteinfragtnente ausgewahlt werden. die an eine 
gegebene Testsubstanz binden. Vorzugsweise handelt es sich dabei urn die Proteine oder Pro- 
teinfiragmente des zweiten Fusionsproteins, da diese mit einer grSBeren Wahrscheinlichkeit 
korrekt gefaltet sind, als die Proteine oder Proteinfiagmente des ersten Fusionsproteins, die 
nur dann korrekt gefaltet sind, wenn die jeweiligen Proteine auch im oxidativen Mileu des 
Periplasmas ihre native Konformation annehmen kfinnen. Eine Testsubstanz im Sinne der 
vorUegenden Erfindung kann jede beliebige chemische Substanz oder ein Gemisch davon 
sein. Vorzugsweise handelt es sich dabei jedoch um ein Protein oder Proteinfiagment, insbe- 
sondere um einen Rezeptor, einen RezeptorUganden. einen Transkriptionsfaktor, einen lonen- 
kanal. ein MolekOl der Signaltransduktionskaskade, Struktur- und Speicherprotein, Toxin 
Oder Lichtrezeptor- und Pigmentprotein. Das Messen der jeweUigen Bindung der unterschied- 
^chen Proteingemische, Vektoren und/oder Zellen der BibUothek an die Testsubstanz kann 
wie vorangehend beschrieben, iiber markierungsabhSngige oder markierungsunabhahngige 
MeBverfahren erfolgen. 



30 



In einer bevorzugten Ausflihrungsform des erfindungsgemaBen Verfahrens enthait das Ver- 
fahren die weiteren Schritte: Auswahlen mindestens eines Proteingemisches. eines Vektors 
Oder einer ZeUe aufgrund der gemessenen Bindung und Herstellen einer zweiten BibUothek, 
wobei die BibUothek durch Modifikation des im ausgewahlten Proteingemisch. im ausge- 
wahlten Vektor oder in der ausgewahlten Zelle enthaltenen Proteins oder Proteinfragments 
erzeugt wird. Der AuswahlprozeB von Proteingemischen, Vektoren oder Zellen aus der Bib- 
Uothek wird vorzugsweise aufgrund der Starice der Bindung durchgefUhrt, wobei die Protein- 
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gemische, Vektoren oder Zellen bevorzugt sind, die die stSrkste Bindmg an die jeweiUge 
Testsubstanz zeigen. Ausgehend von der Aminosauresequenz des im ausgewShlten Piotein- 
gemisch, Vektor oder Zelle enthaltenen Proteins oder Proteinftagments, die durch Standard- 
verfahren bestimmt werden kann, kOnnen Modifikation erzeugt weiden, die jeweils zu gerin- 
5 gen Andeningen der Aminosauresequenz flihren und damit zu einer Vielzahl von Derivaten, 
die im Vergleich zum Ausgangsprotein bzw. Proteinfiagment eine leicht veranderte dreidi- 
mensionale Struktur besitzen. Solche Modifikationen lassen sich durch im Stand der Technik 
bekamite Verfahren beispielsweise durch ZufaUsmutagenese oder auch durch gezielte Substi- 
tution emzelner Nukleinsaurecodons, der fur das Protein oder Proteinfragment kodierenden 
10 Nukleinsaure, erhalten. Bevorzugt sind dabei Substitution, die sogenannte „konservative" 
Substitutionen sind. Eine konservative Substitution liegt dann vor, wenn beispielsweise ein 

•ftir eine basische Aminosaure kodierendes NukleinsSurecodon durch ein anderes fUr eine ba- 
kische Aminosaure kodierendes Nukleinsaurecodon, ein fiir eine saure Aminosaure kodieren- 
des Nukleinsaurecodon durch ein anderes fiir eine sauie Aminpsaure kodierendes Nukleinsau- 
recodon bzw. ein fiir eine polare Aminosaure kodierendes Nukleinsaurecodon durch em ande- 
res ftir eine polare Aminosaure kodierendes Nukleinsaurecodon ersetzt wird. 
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Die auf Grundlage der ausgewahlten Proteingemische, Vektoren oder Zellen neu erzeugten 
zweiten BibUotheken kSnnen nunmehr in einem weiteren Schritt wiederum mit der Testsub- 
20 stanz in Kontakt gebracht werden, worauf in einem weiteren Schritt die jeweilige Bindung der 
Testsubstanz an die modifizierten Proteingemische, Vektoren oder Zellen der zweiten Biblio- 
thek gemessen werden kann. Gegebenenfalls kQnnen nunmehr die Schritte des Ausvs^ens 
^destens eines Proteingemisches, eines Vektors oder einer Zelle aufgrund der gemessenen 
^^indung und die sich daran anschlieBend Herstellung einer dritten bzw. n-ten Bibliothek so- 
25 wie das Inkontaktbringen und Messen der jeweiligen Bindung der Testsubstanz an die unter- 
schiedlichen Protemgemische, Vektoren oder ZeUen der dritten bzw. n-ten Bibliothek, ein bis 
n-mal wiederholt werden bis ein Protemgemisch, ein Vektor oder eine Zelle ausgewahlt wor- 
den ist, das, der bzw. die die gewOnschte Bindung zeigt. 




30 



Das zuvor geschUderte Verfehren wird auch als gerichtete Evolution bezeichnet. da in einer 
Vielzahl von Schritten die aus Modifikation und Selektion bestehen, Proteine oder Protein- 
fragmente „evolutionar« hinsichtlich einer bestimmten Eigenschafl, insbesondere ihrer Bin- 
dungseigenschafl weiterentwickelt werden. 
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Die durch das obige Verfahren aufgefundenen oder zusatzUch hinsichtlich einer bestimmten 
Eigenschaft optiinierten Proteine oder Proteinfragmente kSnnen, wenn sie beispielsweise auf 
die Aktivierung oder Repression eines bestimmten zellulSren Signalwegs bin optimiert wor- 
den sind, als Wirkstofif in einem Medikament eingesetzt werden. Dasselbe gilt fUr die binden- 
5 den Substanzen, die in dem Verfahren zum AuflSnden von potentiell bindenden Substanzen 
identifiziert worden sind. Daher umfassen die erfindungsgemafien Verfahren in einer bevor- 
zugten Ausfuhrungsform den weiteren Schritt, daB die ausgewShlte bindende Substanz oder 
das in dem ausgewShlten Proteingemisch. in dem ausgewShlten Vektor oder in der ausge- 
wahlten ZeUe enthaltene Protein oder Proteinfragment oder eine Variante davon mit eioem 
10 pharmazeutisch akzeptablem Trager und/oder Hilfsstoff gemischt wird. 

•Eine „Variante" des Proteins oder Proteinfiragments beinhaltet Modifikation des N- oder C- 
Terminus oder Modifikation von AminosSureseitenketten, die beispielsweise die StabiUtat. 
Loslichkeit Oder BiokompatibiUtSt des Proteins oder Proteinftagments erhShen. UmfaBt sind 
15 jedochauchFusionsproteine mit den erfindungsgemSBidentifiziertenProteinen Oder Protein- 
fiagmenten, die als weitere Komponenten beispielsweise autofluoreszente Marker, wie bei- 
spielsweise GFP Oder Zytostatika wie beispielsweise Choleratoxin enthalten kSnnen. 

Pharmazeutisch akzeptable TiSger und/oder Hilfsstoflfe umfassen Substanzen, die die binden- 
20 de Substanz bzw. das Protem oder Proteinfragment oder seine Varianten stabiUsieren, deren 
phaimazeutische Vertraglichkeit erhahen oder die ftir die jeweilige Applikationsform, wie 
beispielsweise Tablette, Pflaster oder InfusionslSsung, erforderlich sind, wie beispielsweise 
^onservierungsmittel. Puffer, Salz oder Proteaseinhibitoren. 




25 Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Kit zur Herstellung eines Nuk- 
leinsauregemisches nach Anspruch 10 enthaltend: 

a) mindestens eine erste Nukleinsaure enthaltend mindestens eine RestriktionsschnittsteUe 
5' und/oder 3' von einer Nukleinsaure kodierend ftlr ein erstes Fusionsprotein enthal- 
tend: 

30 i) erne Interaktionsdomane und 

ii) eine Proteintranslokationssequenz, die bewirkt, daB das erste Fusionsprotein bei 
Expression in einem Bakterium in einem im wesentlichen gefalteten Zustand durch 
die zytoplasmatische Membran transloziert wird. 
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Dieses Kit erlaubt die Insertion einer ausgewahlten NukleinsSuresequenz 5' oder 3' von der 

Nukleinsaur^. die fur eine InteraktionsdomSne und eine Proteintranslokationssequenz kodiert, 

so daB im Ergebnis von der resultierenden NukleinsSure ein Fusionsprotein kodiert vnrd, das 

am C-Terminus und/oder am N-Tenninus ein dun^h die jeweUs eingefiihrte Nukleinsaurese- 

5 quenz kodiertes Protein oder Proteinfragment enthSlt. Voizugsweise handelt es sich bei der 

emgeftihrten DNA um eine cDNA-BibUothek, wobei diese besonders bevonmgt unter Ver- 

wendung der 3'.RestriktionsschmttsteUe in die NukleinsSure eingefUhrt wird. In einer bevor- 

zugten AusfUhnmgsform entMlt das Kit den Leuzin-Zipper aus dem cFos-Protein und in einer 

werteren Bevorzugten Ausflihrungsform die Tat-abMngige Proteintranslokationssequenz To- 
10 rA. 



•In emer weiteren Ausftthrungsform des erfindungsgemafien Kits enthait das Kit des weitei^n 
bmdestens eine zweite NukleinsSure enthaltend mindestens eine Restriktionsschnittstelle 5' 
und/oder 3 ' von einer Nukleinsaure kodierend ftir ein zweites Fusionspiot^in enthaltend: 
15 i) eine Interaktionsdomane und 

ii) eine Proteintranslokationssequenz, die bewirkt. daB das zweite Fusionsprotein bei 
Expression in einem Bakterium in einem im wesentUchen ungefalteten Zustand 
durch die zytoplasmatische Membran transloziert wird, wobei die Interaktionsdo- 
mane des ersten Fusionsproteins an die des zweiten Fusionsproteins binden kann. ' 

Diese Nukleinsaux^ erlaubt die Insertion 5' oder 3' von der fur eine Interaktionsdomane und 
eme Protemtranslokationssequenz kodierenden NukleinsSure, so daB im Ergebnis von der 

I resultierenden Nukleinsaure ein Fusionsprotein kodiert wird. das am N- oder C-Teroninus ein 
^on der insertierten Nukleinsaure kodiertes Protein oder Proteinfragment umfaBt Beispiels- 
weise kfimxen Nukleinsauren, die ftir Phagenhullproteine kodieren in die Nukleinsaure inser- 
tiert werden, wobei diese vorzugsweise in die 3 '-Restriktionsschnittstelle eingeftihrt werden. 

Es hat sich gezeigt, daB wemx in die zweite Nukleinsaure Nukleinsauren eingeftihrt werden. 
die ftir Phagenhullproteine kodieren, daB die resultierenden Fusionspioteine bei starker Ex- 
pression von beispielsweise dem ginp-Fusionsprotein zu eine hohen Toxizitat ftir E coli- 
ZeUen ftihren. Aus diesem Gxund wird bei klassischen Phagendisplaysystemen ein Amber- 
Codon 5' von dem gin-Protein eingefttgt. In Supiessorstammen (z.B. XL-1 Blue) wird da- 
durch die Expression des gnip-Fusionsproteins urn ca. 90% reduziert. Dartiber hmaus ennog- 
hcht das Amber-Codon (das in Nicht-Suppressorstammen als STOP-Codon gelesen wird) 
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sehr einfach die losliche Expression des zuvor mit dem Phagenprotein fusionierten und auf 
dem Phagen prSsentierten Proteins, indem das Phagemid in einen Nicht-Suppressorstamm 
(2.B. BL21) eingebracht und dort die Expression durchgefUhrt wird. Daher enthalt die erste 
und/oder die zweite Nukleinsaure in einer bevorzugten Ausfiihrungsform entweder 5 oder 3« 
ein Amber-Codon. Vorzugsweise ist das Amber-Codon in der ersten NukleinsSure 5' ange- 
ordnet und in der zweiten Nukleinsaure 3' angeordnet. Dadurch lafit sich in einem geeigneten 
bakteiiellen Wirt erreichen, daB ausschlieUUch das in der ersten Nukleinsaure 5'eingeftigte 
Protein oder Proteinfragment exprimiert wild und gleichzeitig der toxische Effekt des in der 
zweiten Nukleinsaure 3* eingefllgten glHp verhindert wird. 



In einer weiteien bevorzugten Ausfiihrungsform des erfindungsgemaBen Kits ist die Interakti- 

•onsdomane des zweiten Fusionsproteiris die Leuzin-Zipperdomane des cJun-Proteins. In einer 
Weiteren bevorzugten Ausfiihrungsform enthalt die Nukleinsaure eine Nukleinsaure. die fiir 

eine Sec-abhangige Proteintranslokationssequenz insbesondere das PelB-Ftihrungspeptid ko- 
15 diert. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist die Verwendung einer Zelle zur Her- 
stellung eines erfindungsgemaBen Proteingemisches sowie die Verwendung eines erfindungs- 
gemaBen Proteingemisches. eines erfindungsgemaBen Vektors oder einer erfindungsgemaBen 
20 Zelle zur HersteUung einer erfindungsgemaBen Bibliothek. 

Ein bevorzugtes Anwendungsgebiete der erfindungsgemaBen Proteingemische, erfindungs- 
|emaBen Phagen, der erfindungsgemaBen Zellen, insbesondere der erfindungsgemaBen Bib- 
^otheken, enthaltend vorgenannte Proteingemische, Phagen und Zellen sowie der erfindungs- 
gemaBen Kits, ist die Prasentation von Proteinen auf filamentosen Phagen. Ein besonderer 
Schwerpunkt liegt dabei auf Proteinen, die aufgrund ihrer Inkompatibilitat mit dem Sec- 
Transportweg nicht mit Hilfe der klassischen Phagendisplay-Technologie prasentiert werden 
kSnnen. Als besonders bevorzugte Anwendungsbereiche ergeben sich daher die Presentation 
und Selektion von cDNA-Expressionsbibliotheken und die Presentation und Selektion von 
DNA-BibUotheken zur gerichteten Evolution von Proteinen, auch ..protein engineering" ge- 
nannt 
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Eine weitere bevorzugte Verwendung liegt in der HeisteUmig von PixJteinkonjugaten. Dabei 
ist die Verwendung dami besonders bevorzugt. wemi das Protein oder Proteinfragment des 
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ersten Fusionsproteins und das Protein oder Proteinfiagment des zweiten Fusionsproteins je- 
weils unterschiedliche Anforderungen hinsichtlich der zur korrekten Faltung erforderUchen 
zeUularen Umgebung haben. So erlaubt es die vorliegende Erfindung AntikSrper direkt mit 
Markerproteinen gentechnisch zu fusiomeren, die bei Produktion in Bakterien und Transport 
5 ttber den Sec-abhSngigen Transportweg nicht koiiekt gefaltet wurden und daher bei Anwen- 
dung von Standardverfahren nicht als Markeiprotein zur Markierung des Antikfirper verwen- 
det werden kSnnen, Markeiproteine-Antikfirperfiision, deren funktionelle Expression erst 
durch die vorliegende Erfindung mSgUch geworden ist, umfassen beispielsweise Fusionen aus 
autofloreszierenden Proteine, wie GFP und schweren Immunoglobulinketten, leichten Immu- 
1 0 noglobulinketten oder „single-chain-antibodies". 

Die folgenden Abbildungen und Beispiele dienen lediglich der Dlustration der Erfindung und 
'sind nicht als BeschrSnkung derselben auf die konkret in den Beispielen angegebenen Aus- 
fiihrungsformen zu verstehen. Alle im Text enthaltenen Zitate werden hierdurch in ihrem ge- 
1 5 samten Umfang durch Verweis aufgenommen. 

Abbildungen 

Abb. 1 Konsensussequenzen Tat-abhSngiger, Sec-abhSngiger, SRP-abhangiger oder 

YidC-abhSngiger Signalsequenzen, wobei X eine beliebige AminosSure und # 
eine hydrophobe Aminosaure prflsentieren. 

Abb. 2 Tat-abhangiges TorA-Signalpeptid, wobei X eine beUebige Aminosaure und # 

eine hydrophobe Aminosaiure prasentieren 

Abb. 3 Prinzip des TLF-Systems, wobei CT die Domane des pHI, pelB die Sec- 

Signalsequenz, TSS die Tat-Signalsequenz und POI das prasentierte Protein 
bedeuten. 

30 Abb. 4 Restriktionskarte des Plasmids pCD4/GFP24, dessen Nukleinsauresequenz als 

SEQ ID NR: 1 im Anhang wiedergegeben ist. 

Abb. 5 Restriktionskarte des Plasmids pCAl/GFP24, dessen Nukleinsauresequenz in 

SEQ ID NR: 2 wiedergegeben ist. 




25 
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Abb. 6 Restriktionskarte des Plasmids pCNl/GFP24, dessen Nukleinsauresequenz in 

SEQ ID MR: 3 wiedergegeben ist 

5 Abb. 7 Kompetitiver Phagen-ELISA, wobei weiBe Balken die Ergebnisse mit GFP24- 

prSsaitierende Phagen zeigen. GFP24-Phagen wuiden mit Hilfe von XL-1 
Blue Zelle hergesteUt, die das Plasmid pCD4/GFP24 tragen. Graue Balken pra- 
sentieren die Ergebnisse, die mit P-Lactamase-tragenden Phagen erzielt wur- 
den. p-Lactamase-prasentierende Phagen wurden in XL-1 Blue Zelle herge- 
1 0 stellt, die das Plasmid pCD4/BLA trugen. 

^Abb. 8 Enzymatischer Assay, der Prasentation von P-Lactamase auf Bakteriophage, 

wobei weiiJen Kreise die Ergebnisse mit GFP24-tragende Phagen zeigen, 
GFP24-Phagen wurden mit Hilfe von XL-1 Blue Zelle hergestellt wurden, die 
15 das Plasmid pCD4/GFP24 tragen. Schwarze Vierecke piasentieren die Ergeb- 

nisse die mit p-Lactamase-tragaiden Phagen erzielt wurden. p-Lactamase- 
prSsentierende Phagen wurden in XL-1 Blue Zelle hergestellt, die das Plasmid 
pCD4/BLA trugen. Gezeigt wird die Absorption bei 486 nm in AbhSngigkeit 
von der Zeit. 

20 




Beispiele 

^^ ^Beispiel 1: Verwendete Vektnren 
25 

PCD4/GFP24 ist ein Cysteindisplay-Phagemid, das auf dem pGP-Vektor (Paschke M., et al.: 
(2001) Biotechniques 30: 720-725) beruht. 

pCAl/GFP24 ist ein Cysteindisplay-Phagemid, das auf pGP-FlOO basiert. Es kann fUr die 
30 tet°'''-kontroIlierte Ejcpression von Protein als Fusion von cFos-Leuzin-Zipper verwendet wer- 
den. Die Translokation des cFos-Fusionsproteins im periplasmatischen Raum wird durch die 
TorA-Fiihrungspeptidsequenz (Tat-abhSngige Translokationsweg) vermittelt. Das tet'^'*- 
kontrollierte Transkript enthalt ein zweites Cistron, von dem das c-jun::G3Ps-Fusionsprotein 
exprimiert wird. Das c-Jun::G3Ps wird tiber den Sec-abhSngigen Translokationsweg in dem 
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periplasmatischen Rauin gesteuert. Kovalente Komplexe zwischen dem cFos-Fusionsprotein 
und dem cJun::G3PS-Fusionsprotein werden im periplasmatischen Raum aufgnind der Dime- 
risierung von cJun und cFos und anschUefiender Ausbildung von Cysteinbindungen zwischen 
den Proteinen hergesteUt. Das Phagemid enthSlt eine GFP24-Kassette, flankiert von Sfil- 
Restriktionsstellen an den Positionen 148 und 910 und ist zwischen dem TorA- 
Ftihrungspeptid und cFos angeordnet. Diese Kassette muB durch das zu prSsentierende Prote- 
in ersetzt werden. 



10 




pCAl/GFP24 ist ein von pCD4 abgeleitetes Cysteindisplay-Phagemid, das auf dem pGP- 
Vektor basiert. pCD4/GFP24 ist ein Cysteindisplay-Phagnid, das auf dem pGP-Vektor 
(Paschke M., et al.: (2001) Biotechniques 30: 720-725) beruht Es kann fiSr die tet°-P- 
kontroUierte Expression von Proteinen als Fusion mit dem cFos-Leucinzipper verwendet wer- 
Men. Die Translokation des cFos-Fusionsproteihs in den periplasmatischen Raum wird durch 
das TorA-Fiihrungspeptid (Tat-Transportweg) veimittelt Das tet'^P-kontroUierte Transkript 
15 enthalt em zweites Cistron. von dem das c-jun::G3Pss Fusionsprotein exprimiert wird (G3Pss 
umfaBt Aminosauren 252 bis 406 des reifen glH-Proteins des fd-Phagen). Das c-jun:G3Pss 
wird durch einen Sec-abhSngigen Transportweg (pelB-Ftihrungspeptid) in dem periplasmati- 
schen Raum gelenkt. Kovalente Komplexe von cFos-Fusionsprotein und c-jun::G3Pss werden 
aufgrund der Dimerisierung zwischen cJun und cFos im periplasmatischen Raum und die an- 
20 schUeBende Ausbildung von Cysteinbindung zwischen den Proteinen gebildet (Crameri, R. 
und Suter M. (1993), siehe oben). Der Phagendisplay der Proteine, die mit cFos fusioniert 
smd, kann durch sogenannten Helferphargenrescue erreicht werden. Im Gegensatz zu pGP 

•iibertragt das Phagemid pCD4-GFP24 Chloramphenicokesistenz. Das Resistenzgen (CAT) 
Wd der tet-Repressor (TetR) werden unter KontroUe des p-Lactamasepromotors von einer 
25 bicistronischen Kassette kontroUiert. Das Transkript wird in einem X-Phagenterminator termi- 
niert. Die Tat-TetR-Kassette ist in umgekehrter Orientierung zu der cFos- und cJun- 
Fusionskassette. Eine GFP24-Kassette, flankiert an der Position 148 und 910 von Sfil- 
RestriktionssteUen ist zwischen dem TorA-Fiflu:ungspeptid und cFos angeordnet Diese Kas- 
sette wird durch das zu prSsentierenden Protein ersetzt. 



30 



pCD4/Bla ist ein von pCD4/GFP24 abgeleitetes Cysteindisplay-Phagemid, bei dem mittels 
Restriktion mit Sfil das GFP24 Fragment durch die Sequenz der reifen TEMl p-Lactamase 
ersetzt wurde. Die eingefUgte Lactamaseklonierungskasette mit 5* und 3'-terminalen Sfil- 
Restriktionsstellen ist in SEQ ID NR: 4 wiedergegeben. 
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Beispiel 2: Herstellung von Bakteriophaeen 



Mit dem entsprechenden Phagemid transfonnierte XLI-Blue-Zellen wurden in 2 TY- 
5 Selektionsmedium bei SO^C bis zu einem ODeoonm von 0,5 kultiviert und dann mit dem Hel- 
ferphagen VCSM13 mit einem Moi = 10-20 gemischt. Die infizierte Kultur wurde flir 30 Mi- 
nuten bei 37°C kultiviert und anschlieBend mit ICanamizin in einer Endkonzentration von 60 
Hg/ml versetzt. Die Kultur wurde flir 10 Minuten bei 25**C kultiviert. Durch Zentrifiigation 
(4000 X g, 4**C, 5 Minuten) wurden die Zellen geemtet und anschlieBend in 2 TY- 
10 Selektionsmedium enthaltend 60 ng/1 Kanamizin und 0,5 ^g/ml Tetracyclin resuspendiert. 
Diese Kultur wurde fur 5 h bei 25°C kultiviert. AnschlieBend folgte die PhagenprSparation 

•aus dem Zellkulturiiberstand wie folgt: Jewells 40-50 ml Zellen und Zelltrflmmer wurden 
durch Zentrifiigation (4°C, 10.000 rpm in einem A8-24-Rotor flir 15 Minuten) vom phagen- 
haltigen Zellkulturuberstand getrennt. Der Oberstand wurde durch einen 0,45 ^m Filter filt- 
1 5 riert und mit 'A Volumen PEG-NaCl-L6sung (20% w/v PEG 8000, 50% w/v NaCl) gemischt 
und tiber Nacht oder fur mindestens eine Stunde auf Eis inkubiert. Die Mischung wurde dann 
bei 4°C fUr 15 min bei 15.000 rpm in einem A8.24-Rotor zentrifugiert. Der Niederschlag 
wurde in 2,5 ml eiskaltem PBS resuspendiert und auf 2 ml Plastikr6hrchen verteilt Daim 
wurde der Oberstand mit Ya Volumen PEG-NaCl-LOsung gemischt und filr mindestens eine 
20 weitere Stunde auf Eis inkubiert. AnschlieBend wurde der tJberstand bei 4°C und 14.000 rpm 
far 15 Minuten zentrifugiert. Der Phagenniederschlag wurde in 0,5-1 ml PBS gelOst Gegebe- 
nenfalls wurde die PhagenlSsung durch einen 0,45 )iim-Filter filtriert und anschlieBend bei 

•4°C gelagert. Bei langerer Lagerung wurde die PhagenlQsung mit 1 Volumen Glycerol ver- 
setzt vmd bei -70°C gelagert. 

25 

Der Phagentiter wurde durch Standardverfahren unter Verwendung einer Verdflnnungsreihe 
bestimmt. Der Titer lag ttblicherweise zwischen 10*^ und lO" cfu/ml. 

Beispiel 3: PrMsentation von fimktionellem GFP24 auf Phagen 

30 

GFP24 ist eine zirkuiarpermutierte Variante des griin fluoresziarenden Proteins, die zusMtzlich 
ein Epitop des P24-Proteins aus HIV enthait (H6hne, W.E. et al. (1993) Mol Immunol 
30:1213-21). GFP24 wird durch den anti-P24-Antik6rper CB4-1 (Dr. Scholz, Institut fiir Bio- 
chemie, (Universitatsklinikum Charite)) mit hoher Afanitat gebunden. GFP24 kann wie auch 
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GFP selbst nicht tiber den Sec-Transportweg exportiert werden, Ein funktionelles GFP24 Pro- 
tein soUte daher bei Expression des oben geschriebenen pCD4/GFP24-Plasmids nur dann zur 
Prasentation eines fiinktionsfehigen GFP24 flihren, wenn dieser Teil des Proteins nicht durch 
einen Sec-abhangigen Transportweg, sondem durch einen Tat-abhSngigen Transportweg in 
5 das Periplasma transportiert worden ist Urn GFP24 auf filamentosen Phagen nachzuweisen, 
wurde ein Phagen-ELISA wie folgt durchgefllhrt. Mikrotiterplatten wurden mit 10 ^m/ml 
anit-P24Antik6rper-C4-l beschichtet, dreimal mit PBS/Tween 0,1% gewaschen und mit 200 
Hl pro Vertiefung Genosys-Blockienmgsreagenz (Sigma-Genosys Ltd, Cambridge, UK)) ftir 
ein bis zwei Stunden bei Raumtemperatur unter Schuttehi inkubiert. AnschlieBend wurde die 
10 Mikrotiterplatte dreimal mit PBS/Tween 20 0,1% gewaschen. AnschlieBend wurden 50 \x\ pro 
Vertiefung GFP24 prasentierende Phagen mit und ohne P24-Peptid in die Mikrotiterplatte 

•gegeben und anschlieflend die Gegenwart des Phagen in der Mikrotiterplatte mit einem Meer- 
rettichperoxidase gekoppelten anti-Phagen-Antikarper (Seramun Diagnostica GmbH, Dol- 
genbrodt, Germany)) nachgewiesen. Die Signalstarke entsprach dabei dem an CB4-1 gebun- 
15 denen Phagen. pCD4/GFP24 Phagen wurden dabei vollstSndig von CB4-1 durch das P24- 
Peptid verdrSngt, wShrend p- Lactamase prasentierende Phagen (pCD4/BLA), die als Kon- 
troUe verwendet wurden, nicht an CB4-1 gebunden wurden. DarUber hinaus konnte keine 
imspezifische Bindimg an anderer Antikorper oder das Blockierungsreagenz beobachtet wer- 
den (s. Abb. 7). 

20 

Beispiel 4: Pras entation von TEM-l-B- Lactamase auf filamentosen Phagen 

•TEM-l-p-Lactamase ist ein periplasmatischen Protein, das durch die Hydrolyse des Lactam- 
rings des Antibiotikums Ampicillin Resistenz gegen Ampicillin vermitteln kann. TEM-P- 
25 Lactamase wird nonnalerweise mittels des Sec-abhSngigen Transportsystems ins Periplasma 
exportiert. Zum Nachweis, daB TEM-l-p- Lactamase auch durch den Tat-abhSngigen Trans- 
portweg exportiert werden kann, wurde die Sec-Signalsquenze entfemt und durch die TorA- 
Sequenz ersetzt. Die erfolgreiche Prasentation von TEM-l-p- Lactamase wurde mit dem 
nachfolgend beschriebenen Enzymessay nachgewiesen, dessen Ergebnis in Abb. 8 dargestellt 
30 ist. 800 fil PBS pH 7,4 wurden mit 100 [xl Nitrocefin-Stammlosimg (500 jig/ml) gemischt und 
auf 25°C temperiert. 100 |il Phagenlosung wurden hinzugegeben. Die ExtinktsionsSnderung 
bei 486 nm wurde photometrisch tiber 10 min. beobachtet. Die Absorptionsanderung bei 486 
nm entspricht dabei der p-Lactamaseaktivitat der Phagen, WShrend pCD4/GFP24-Phagen 
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keine P-Lactamaseaktivitat zeigten, war bei pCD4/BLA eine starke P-Lactamaseaktivitat zu 
beobachten. 

Die Nitroce fin sta mml Ssvmg wurde folgendennaBen hergestellt: 1 mg NitrocejBn wurd in 100 
H\ DMSO geiast. Diese LOsung wurde dann mit 1,9 ml PBS pH 7,4 gemischt Die Losung 
wurde fihr maximal zwei Wochen bei -20°C gelagert. 
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Anpriiche 

Proteingemisch enthaltend: 

a) mindestens ein erstes Fusionsprotein enthaltend: 

i) ein Protein oder Proteinfragment, 

ii) eine Interaktionsdomane und 

iii) eine Proteintranslokationssequenz, die bewirkt, daB das Fusionsprotein bei 
Expression in einem Bakterium in einem im wesentlichen ungefalteten Zustand 
dnrch die zytoplasmatische Membran transloziert wird, 

und 

15 b) mindestens ein zweites Fusionsprotein enthaltend: 

i) ein Protein oder Proteinjfragment, 

ii) eine Interaktionsdomane xmd 

iii) eine Proteintranslokationssequenz, die bewirkt, daU das Fusionsprotein bei 
20^ Expression in einem Bakterium in einem im wesentlichen gefalteten Zustand 

durch die zytoplasmatische Membran transloziert wird, 

wobei die Interaktionsdomane des ersten Fusionsproteins an die des zweiten 
Fusionsproteins binden kann. 

25 

2. Proteingemisch nach Anspruch 1, wobei das Protein oder Proteinfiragment des ersten 
Fusionsproteins eine schwere Immimoglobulinkette, eine leichte hnmunoglobulinkette, 
ein single-chain Antikarper, ein Diabody, ein Rezeptor, ein Rezeptorligand, ein 
Integrin, ein Intimin, ein Kohlenhydrat-bindendes Protein, ein Albumin-bindendes 
30 Protein oder Protein A ist. 
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3. Proteingemisch nach Anspruch 1 oder 2, wobei das Protein oder Proteinfragment des 
zweiten Fusionsproteins ein autofluoreszierendes Protein, insbesondere GPP oder eine 
Variante davon, ein Enzym, ein Cofaktor-abhSngiges Protein, ein Protein, das von einer 
aus einer cDNA-Bibliothek stammenden cDNA kodiert wird, oder ein synthetisches 
Protein ist 

4. Proteingemisch nach Anspruch 1, wobei das Protein oder Proteinfragment des ersten 
Fusionsproteins und die Proteintranslokationssequenz ein Phagenhflliprotein, ein 
peripiasmatisches Markerenzym, ein Intimin, ein Protein der auBeren 
Bakterienmembran oder ein peripiasmatisches Rezeptorprotein ist. 

r Proteingemisch nach Anspruch 4, wobei das Phagenhiillprotein ausgewahlt ist aus den 
MlS-Phagenhflllproteinen pIII, pVI, pVH, pVIII und pIX. 

6. Proteingemisch nach einem der AnsprQche 1 bis 5, wobei die Interaktionsdomanen des 
ersten und zweiten Fusionsproteins jeweils eine Leuzin-Zipper-DomSne und eine 
Leuzin-Zipper-DomSne, eine Helix-Loop-Helix-DomSne und eine Helix-Loop-Helix- 
DomSne, ein Cahnodulin und ein Cahnodulin-bindendes Peptid oder ein Peptid-Dimer- 
Paar naturlichen oder synthetischen Ursprungs sind. 

7. Proteingemisch nach einem der Anspriiche 1 bis 6, wobei die Proteintranslokations- 
sequenz des ersten Fusionsproteins eine Sec-abhangige, SRP-abhangige, YidC- 

I abhSngige Sequenz oder eine Transportweg-vmabhSngige Sequenz, die in die Membran 
integriert wird, ist. 

8. Proteingemisch nach einem der Anspriiche 1 bis 7, wobei die Proteintranslokations- 
sequenz des zweiten Fusionsproteins eine Tat-abhangige oder Thylakoid-ApH- 
abhangige Sequenz ist. 

9. Proteingemisch nach einem der Anspriiche 1 bis 8, wobei das erste Fusionsprotein an 
das zweite Fusionsprotein kovalent oder nicht-kovalent gebunden ist. 

10. Nukleinsauregemisch kodierend fiir ein Proteingemisch nach einem der Anspriiche 1 bis 
8. 
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1 1 . Nukleinsauregemisch nach Anspruch 10, wobei mindestens zwei Nukleinsauren, die flir 
unterschiedliche Fusionsproteine kodieren, kovalent miteinander verbunden sind, 

12. Vektor enthaltend ein Proteingemisch nach einem der Anspriiche 1 bis 9 xind/oder ein 
Nukleinsauregemisch nach einem der Anspriiche 10 oder 11, 

13. Zelle enthaltend ein Proteingemisch nach einem der Anspriiche 1 bis 9, ein 
Nukleinsauregemisch nach einem der Anspriiche 10 oder 11 imd/oder einen Vektor 
nach Anspruch 12. 

14. Bibliothek enthaltend mindestens zwei Proteingemische nach einem der Anspriiche 1 
bis 9, mindestens zwei Vektoren nach Anspruch 12 imd/oder mindestens zwei Zellen 
nach Anspruch 13, wobei die Proteine oder Proteinfragmente der jeweiligen ersten oder 
jeweiligen zweiten Fusionsproteine voneinander unterschiedlich sind. 

15. Verfahren zimi Auffinden von Substanzen, die an ein Proteingemisch nach einem der 
Anspriiche 1 bis 9, an einen Vektor nach Anspruch 12 oder an eine Zelle nach Anspruch 
13 binden, enthaltend die Schritte: 

a) In-Kontaktbringen mindestens einer potentiell bindenden Substanz mit einem 
Proteingemisch nach einem der Anspriiche 1 bis 9, einem Vektor nach Anspruch 12 
und/oder einer Zelle nach Anspruch 13 und 

b) Messen der Bindung der potentiell bindenden Substanz an das Proteingemisch, den 
Vektor und/oder die Zelle, 

16. Verfahren zum Auffinden von Proteinen oder Proteinfragmenten, die an eine 
Testsubstanz binden, enthaltend die Schritte: 

a) In-Kontaktbringen mindestens einer Testsubstanz mit einer Bibliothek nach 
Anspruch 14 und 



b) Messen der jeweiligen Bindimg der Testsubstanz an die unterschiedlichen 
Proteingemische, Vektoren und/oder Zellen der Bibliothek. 

Verfahren nach Anspruch 16 enthaltend die weiteren Schritte: 

a) Auswahlen mindestens eines Proteingemisches, eines Vektors oder einer Zelle auf 
Grund der geraessenen Bindung und 

b) Herstellen einer zweiten Bibliothek, wobei die Bibliothek durch Modifikation des 
im ausgewahlten Proteingemisch, im ausgewahlten Vektor oder in der 
ausgewahlten Zelle enthaltenden Proteins oder Proteinfragments erzeugt wird. 

Verfahren nach Anspruch 16 enthaltend die weiteren Schritte: 

a) Auswahlen mindestens eines Proteingemisches, eines Vektors oder einer Zelle auf 
Grund der gemessenen Bindung, 

b) Herstellen einer zweiten Bibliothek, wobei die Bibliothek durch Modifikation des 
im ausgewahlten Proteingemisch, im ausgewahlten Vektor oder in der 
ausgewahlten Zelle enthaltenden Proteins oder Proteinfragments erzeugt wird, 

c) In-Kontaktbringen mindestens einer Testsubstanz mit der zweiten Bibliothek, 

d) Messen der jeweiligen Bindung der Testsubstanz an die xmterschiedlichen 
Proteingemische, Vektoren oder Zellen der zweiten Bibliothek und 

e) gegebenenfalls Wiederholen der Schritte a) bis d) bis ein Proteingemisch, ein 
Vektor oder eine Zelle ausgewShlt wird, das, der bzw. die die gewiinschte Bmdung 
zeigt. 

Verfahren nach einem der Anspruche 15 bis 18, wobei in einem weiteren Schritt die 
bindende Substanz oder das in dem ausgewahlten Proteingemisch, in dem ausgewahlten 
Vektor oder in der ausgewahlten Zelle enthaltende Protein oder Proteinfragment oder 



eine Variante davon mit einem phaimazeutisch akzeptablen Trager und/oder Hilfsstoff 
gemischt wird. 



Kit zur Herstellung eines Nukleinsauregemisches nach Anspruch 10 enfhaltend: 

a) mindestens eine erste Nukleinsaure enthaltend mindestens eine 
Restriktionsschnittstelle 5* und/oder 3* von einer Nukleinsaure kodierend fUr ein 
erstes Fusionsprotein enfhaltend: 

i) eine Interaktionsdomane und 

ii) eine Proteintranslokationssequenz, die bewirkt, daB das erste Fusionsprotein 
bei Expression in einem Bakterium in einem im wesentlichen gefalteten 
Zustand durch die zytoplasmatische Membran transloziert wird. 

Kit nach Anspruch 20, desweiteren enthaltend: 

a) mindestens eine zweite Nukleinsaure enthaltend mindestens eine 
Restriktionsschnittstelle 5' und/oder 3* von einer Nukleinsaure kodierend fllr ein 
zweites Fusionsprotein enthaltend: 

i) eine InteraktionsdomSne und 

ii) eine Proteintranslokationssequenz, die bewirkt, daB das zweite Fusionsprotein 
bei Expression in einem Bakterium in einem im wesentlichen ungefalteten 
Zustand durch die zytoplasmatische Membran transloziert wird, 

wobei die InteraktionsdomSne des ersten Fusionsproteins an die des zweiten 
Fusionsproteins binden kann. 

Verwendung einer Zelle nach Anspruch 13 zur Herstellung eines Proteingemisches 
nach einem der AnsprQche 1-9. 

Verwendung eines Proteingemisches nach einem der AnsprQche 1 bis 9, eines Vektors 
nach Anspruch 12 und/oder einer Zelle nach Anspruch 13 zur Herstellung einer 
Bibliothek nach Anspruch 14. 
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Zusammenfassung 

Die vorliegende Erfindxmg betrifft ein Proteingemisch, enthaltend mindestens ein erstes 
Fiisionsprotein, enthaltend ein Protein oder Proteinfragment, eine InteraktionsdomSne xmd 
eine Proteintranslokationssequenz, die bewirkt, dafi das Fusionsprotein bei Expression in ein 
Bakterium in einem im wesentlichen ungefalteten Zustand dutch die zytoplasmatische 
Membran transloziert wird, iind mindestens ein zweites Fusionsprotein, enthaltend ein Protein 
Oder Proteinfragment, eine Interaktionsdomane und eine Proteintranslokationssequenz, die 
bewirkt, daB das Fusionsprotein bei Expression in einem Bakterixmi in einem im wesentlichen 

Il^efalteten Zustand durch die zytoplasmatische Membran transloziert wird, wobei die 
Interaktionsdomane des ersten Fusionsproteins an die des zweiten Fusionsproteins binden 
kaim. 



SEQUENZPROTOKOLL 



<110> Universitatsklinikum Charity 

<120> Gemisch mindestens feweier Fusionsproteine sowie ihre Herstellung und 

Verwendung 

<130> U30038 
<160> 4 

<170> Word 98, Windows 

<210> 1 
<211> 4765 
<212> DNA 

<213> ktinstliche Sequenz 
<220> 

_ <221> PCD4/GFP24 Klonierungs- und Expressionsvektor 
^^^400> 1 

ctagataaga aggaagaaaa ataatgaaca ataacgatct ctttcaggca tcacgtcggc 60 
. gttttctggc acaactcggc ggcttaaccg tcgccgggat gctggggccg tcattgttaa 120 
cgccgcgacg tgcgactgcg gcccagccgg ccatggcggg atccgttcaa ctagcagacc 180 
attatcaaca aaatactcca attggcgatg gccctgtcct tttaccagac aaccattacc 240 
tgtcgacaca atctgccctt tcgaaagatc ccaacgaaaa gcgtgaccac atggtccttc 300 
ttgagtttgt aactgctgct gggatttccg gtggtggtgg tgctaccccg caggacctga 360 
acaccatgct gggtggtggt ggtagtaaag gagaagaact tttcactgga gttgtcccaa 420 
ttcttgt.tga attagatggt gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg 480 
aaggtgatgc aacatacgga aaacttaccc ttaaatttat ttgcactact ggaaaactac 540 
ctgttccatg gccaacactt gtcactactt tctcttatgg tgttcaatgc ttttcccgtt 600 
atccggatca tatgaaacgg catgactttt tcaagagtgc catgcccgaa ggttatgtac 660 
aggaacgcac tatatctttc aaagatgacg ggaactacaa gacgcgtgct gaagtcaagt 720 
ttgaaggtga tacccttgtt aatcgtatcg agttaaaagg tattgatttt aaagaagatg 780 
gaaacattct cggacacaaa ctcgagtaca actataactc acacaatgta tacatcacgg 840 
cagacaaaca aaagaatgga atcaaagcta acttcaaaat tcgccacaac attgaagatt 900 
cggcctcggg ggccgcagaa caaaaactca tctcagaaga gaatctgtat ttccagggcg 960 
atgcttgcgg tggcaccgac accctgcaag ctgaaaccga ccagctggaa gacgagaaat 1020 

•ccgctctgca gactgaaatc gctaacctgc tgaaagagaa agagaaactg gaattcattc 1080 
tggctgctca cggcggttgt gggctaggct aataacttaa gccaaggagg aaaataaaat 114 0 
gaaataccta ttgcctacgg cagccgctgg attgttatta ctcgcggcac agccggccat 1200 
ggcaagcatc tgcggtggcc gtatcgctcg tctggaagaa aaagttaaaa ccctgaaagc 1260 
tcagaactcc gaactggctt ccaccgctaa catgctgcgt gaacaggttg ctcagctgaa 1320 
gcagaaagtt atgaaccacg gcggttgtgg tggcggttcc ctagcgggct ccggttccgg 1380 
tgattttgat tatgaaaaaa tggcaaacgc taataagggg gctatgaccg aaaatgccga 1440 
tgaaaacgcg ctacagtctg acgctaaagg caaacttgat tctgtcgcta ctgattacgg 1500 
tgctgctatc gatggtttca ttggtgacgt ttccggcctt gctaatggta atggtgctac 1560 
tggtgatttt gctggctcta attcccaaat ggctcaagtc ggtgacggtg ataattcacc 1620 
tttaatgaat aatttccgtc aatatttacc ttctttgcct cagtcggttg aatgtcgccc 1680 
ttatgtcttt ggcgctggta aaccatatga attttctatt gattgtgaca aaataaactt 17 4 0 
attccgtggt gtctttgcgt ttcttttata tgttgccacc tttatgtatg tattttcgac 1800 
gtttgctaac atactgcgta ataaggagtc ttaataagct tgacctgtga agtgaaaaat 18 60 
ggcgcacatt gtgcgacatt ttttttgtct gccgtttacc gctactgcgt cacggatctc 1920 
cacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 1980 
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 2040 
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 2100 
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 2160 
ccatcgccct gatagacggt ttttcgccct ttgacgt.tgg agtccacgtt ctttaatagt 2220 
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 2280 
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 2340 
aacgcgcatg ctaacaaaat attaaaaaac gcccggcggc aaccgagcgt taatagtgaa 2400 





gttaccatca cggaaaaagg ttatgctgct tttaagaccc actttcacat ttaaattatt 2 4 fin 

ccctttcttc ttt.%c«!ct tStic"« ti*4c'ns? iiiitimi 

iSi SSi ~ « -'-s ~ 
"?:=Li --"s^i ^j'^^K- ^i^s 

cctcaatggc taaggcgtcg agcaaagccc gcttattttt tacatgccaa tacaatol-ao ylln 

mm tgggcgagtt tacgggttgt taaaccttcg a^tccgacc? S^oS 

at^cctlt^! ctctaatgcg ctgttaatca ctttactttt atctaaacga gacSca?^ sSeS 

attcctatta cgccccgccc tgccactcat cgcagtactg ttgtaattca ttaaacattc ^I9n 

s?tScg c ?sssta: tss^ss rr^^'' "^^^'""^ 

tattggccac att?aaat^« !^ ^ ^^^ftgaaaac gggggcgaag aagttgtcca 3240 

acata?t"c aa^aaanco^ ^"^^^^tga aactcaccca gggattggct gagacgaaaa 3300 
cttgcgaa^a JataJata!^ ttagggaaat aggccaggtt ttcaccgtaa cacgccacat 3360 

,1 a ? K~ S--- f^llllllll 3.0 
kaSSaSc "'"''""^ gtctggttat aggtacatt, .gcaac?gac tgata?goc? Itlo 

f""a?:ct "t"?:^?? LitKs?? c^^g^sf r""""' '''s 

gcggatacat atttga.tgt' ItllllltH UllllllH ^^^^^tc^J c^^^S^?' Ss!? 
ccStttgS tTt'^l" '"a'^srcg ttactagttt aSaJgatS Iggjg^agat lloo 
^alS-^S ~S ~e 

cg=?SlctI atlo?^^:? gccaccactt ca.gaactct gtfgcccgc SS?acS S 
cgcuotgcta atootgttao oagtggotgo tgccagtggc gataagtcot otottaccao a2sn 
gttggactoa agacgatagt taccgg.ta. ggcgoagcgg icgggltgS ™aaaaot?c till 

SgS- S~ g^gL-^Kg £ 
HlUlim HmZll cctatcagtg atag.gaaaa 4740 

A T C 



<210> 2 

<211> 4971 

<212> DNA 

<213> kUnstliche Sequenz 



<220> 

<221> PCA1/GFP24 Klonierungs- und Expressionsvektor 
<400> 2 

ctagataaga aggaagaaaa ataatgaaca ataacgatct ctttcaggca tcacqtcaac 
gttttctggc aoaactcggc ggcttaaccg tcgccgggat gctggggccg ^cat?at?Ia 
a?ta?cKS aIa?:S^"^ ^cccagccgg ccatg^^^gg ItclllUll cSgcaSa^c 
?g^cgacaca atc^accS f"^^*^^^^^ gccctgtcct tttaccagac aaccatLcc 
Itlt^t^t t ^^^'^^ccctt tcgaaagatc ccaacgaaaa gcgtgaccac atggtccttc 
acacca^gS aaSaat^^J g^gatttccg gtggtggtgg ?g^taccccg caggacc^g: 
ttf.^^ZZf''^ gggtggtggt ggtagtaaag gagaagaact tttcactgga gttgtcccaa 
ttcttgttga attagatggt gatgttaatg ggcacaaatt ttctgtcagt ggaSaaato 
aaggtgatgc aacatacgga aaacttaccc ttaaatttat ttgcLtact ggaaaaSac 
ctgttccatg gccaacactt gtcactactt totcttatgg tg?tcaatoc ????ec2^^ 
atccggatca tatgaaacgg catgactttt tcaagagtgc cKgcccgS aa"a?a?an 
aggaacgcac tatatctttc aaagatgacg ggaa?tL!a Scg^gtg^: Sag^clagt 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 




a 



ttgaaggtga 
gaaacattct 
cagacaaaca 
cggcctcggg 
ggcccaaacc 
tgcaagctga 
acctgctgaa 
aacttaagcc 
gttattactc 
cggtggccgt 
actggcttcc 
gaaccacggc 
aatggcaaac 
tgacgctaaa 
cattggtgac 
taattcccaa 
tcaatattta 
taaaccatat 
gtttctttta 
taataaggag 
ftttttttgt 
fcattaagcg 
:tagcgcccg 
cgtcaagctc 
gaccccaaaa 
gtttttcgcc 
ggaacaacac 
tcggcctatt 
atattaacgc 
tgtttatttt 
atgcttcaat 
attccctttt 
gtaaaagatg 
agcggtaaga 
aaagttctgc 
cgccgcatac 
cttacggatg 
actgcggcca 
cacaacatgg 
ataccaaacg 
ctattaactg 
bcggataaag 
gataaatctg 
ggtaagccct 
cgaaatagac 
atgtctcgtt 
ggaatcgaag 
ttgtattggc 
gataggcacc 
aataacgcta 
ttaggtacac 
tgccaacaag 
actttaggtt 
cctactactg 
ggtgcagagc 
cttaaatgtg 
tagtttaaaa 
cgtgagtttt 
gatccttttt 
gtggtttgtt 
agagcgcaga 
aactctgtag 
agtggcgata 



tacccttgtt 
cggacacaaa 
aaagaatgga 
ggccgcagaa 
ttccaccccg 
aaccgaccag 
agagaaagag 
aaggaggaaa 
gctgcccaac 
atcgctcgtc 
accgctaaca 
ggttgtgcta 
gctaataagg 
ggcaaacttg 
gtttccggcc 
atggctcaag 
ccttctttgc 
gaattttcta 
tatgttgcca 
tcttaataag 
ctgccgttta 
cggcgggtgt 
ctcctttcgc 
taaatcgggg 
aacttgatta 
ctttgacgtt 
tcaaccctat 
ggttaaaaaa 
ttacaatttc 
tctaaataca 
aatattgaaa 
ttgcggcatt 
ctgaagatca 
tccttgagag 
tatgtggcgc 
actattctca 
gcatgacagt 
acttacttct 
gggatcatgt 
acgagcgtga 
gcgaactact 
ttgcaggacc 
gagccggtga 
cccgtatcgt 
agatcgctga 
tagataaaag 
gtttaacaac 
atgtaaaaaa 
atactcactt 
aaagttttag 
ggcctacaga 
gtttttcact 
gcgtattgga 
atagtatgcc 
cagccttctt 
aaagtgggtc 
ggatctaggt 
cgttccactg 
ttctgcgcgt 
tgccggatca 
taccaaatac 
caccgcctac 
agtcgtgtct 



aatcgtatcg 
ctcgagtaca 
atcaaagcta 
caaaaactca 
cctggttctt 
ctggaagacg 
aaactggaat 
ataaaatgaa 
cagcgatggc 
tggaagaaaa 
tgctgcgtga 
gcggtggcgg 
gggctatgac 
attctgtcgc 
ttgctaatgg 
tcggtgacgg 
ctcagtcggt 
ttgattgtga 
cctttatgta 
cttgacctgt 
ccgctactgc 
ggtggttacg 
tttcttccct 
gctcccttta 
gggtgatggt 
ggagtccacg 
ctcggtctat 
tgagctgatt 
^ggtggcact 
ttcaaatatg 
aaggaagagt 
ttgccttcct 
gttgggtgca 
ttttcgcccc 
ggtattatcc 
gaatgacttg 
aagagaatta 
gacaacgatc 
aactcgcctt 
caccacgatg 
tactctagct 
acttctgcgc 
gcgtggctct 
agttatctac 
gataggtgcc 
taaagtgatt 
ccgtaaactc 
taagcgggct 
ttgcccttta 
atgtgcttta 
aaaacagtat 
agagaatgca 
agatcaagag 
gccattatta 
attcggcctt 
ttaaaagcag 
gaagatcctt 
agcgtcagac 
aatctgctgc 
agagctacca 
tgtccttcta 
atacctcgct 
taccgggttg 



agttaaaagg 
actataactc 
acttcaaaat 
tctcagaaga 
caggcgcctg 
agaaatccgc 
tcattctggc 
atacctattg 
cgcacaggtt 
agttaaaacc 
acaggttgct 
ctccggttcc 
cgaaaatgcc 
tactgattac 
taatggtgct 
tgataattca 
tgaatgtcgc 
caaaataaac 
tgtattttcg 
gaagtgaaaa 
gtcacggatc 
cgcagcgtga 
tcctttctcg 
gggttccgat 
tcacgtagtg 
ttctttaata 
tcttttgatt 
taacaaaaat 
tttcggggaa 
tatccgctca 
atgagtattc 
gtttttgctc 
cgagtgggtt 
gaagaacgtt 
cgtattgacg 
gttgagtact 
tgcagtgctg 
ggaggaccga 
gatcgttggg 
cctgtagcaa 
tcccggcaac 
tcggcccttc 
cgcggtatca 
acgacgggga 
tcactgatta 
aacagcgcat 
gcccagaagc 
ttgctcgacg 
gaaggggaaa 
ctaagtcatc 
gaaactctcg 
ttatatgcac 
catcaagtcg 
cgacaagcta 
gaattgatca 
cataaccttt 
tttgataatc 
cccgtagaaa 
ttgcaaacaa 
actctttttc 
gtgtagccgt 
ctgctaatcc 
gactcaagac 



tattgatttt 
acacaatgta 
tcgccacaac 
gaatctgtat 
cggtggcctg 
tctgcagact 
tgctcacggc 
cctacggcag 
aaactgctcg 
ctgaaagctc 
cagctgaagc 
ggtgattttg 
gatgaaaacg 
ggtgctgcta 
actggtgatt 
cctttaatga 
ccttatgtct 
ttattccgtg 
acgtttgcta 
atggcgcaca 
tccacgcgcc 
ccgctacact 
ccacgttcgc 
ttagtgcttt 
ggccatcgcc 
gtggactctt 
tataagggat 
ttaacgcgaa 
atgtgcgcgg 
tgagacaata 
aacatttccg 
acccagaaac 
acatcgaact 
ttccaatgat 
ccgggcaaga 
caccagtcac 
ccataaccat 
aggagctaac 
aaccggagct 
tggcaacaac 
aattgataga 
cggctggctg 
ttgcagcact 
gtcaggcaac 
agcattggta 
tagagctgct 
taggtgtaga 
ccttagccat 
gctggcaaga 
gcgatggagc 
aaaatcaatt 
tcagcgcagt 
ctaaagaaga 
tcgaattatt 
tatgcggatt 
ttccgtgatg 
tcatgaccaa 
agatcaaagg 
aaaaaccacc 
cgaaggtaac 
agttaggcca 
tgttaccagt 
gatagttacc 



aaagaagatg 
tacatcacgg 
attgaagatt 
ttccagggcg 
accgacaccc 
gaaatcgcta 
ggttgttaat 
ccgctggatt 
agagcgcttg 
agaactccga 
agaaagttat 
attatgaaaa 
cgctacagtc 
tcgatggttt 
ttgctggctc 
ataatttccg 
ttggcgctgg 
gtgtctttgc 
acatactgcg 
ttgtgcgaca 
ctgtagcggc 
tgccagcgcc 
cggctttccc 
acggcacctc 
ctgatagacg 
gttccaaact 
tttgccgatt 
ttttaacaaa 
aacccctatt 
accctgataa 
tgtcgccctt 
gctggtgaaa 
ggatctcaac 
gagcactttt 
gcaactcggt 
agaaaagcat 
gagtgataac 
cgcttttttg 
gaatgaagcc 
gttgcgcaaa 
ctggatggag 
gtttattgct 
ggggccagat 
tatggatgaa 
ggaattaatg 
taatgaggtc 
gcagcctaca 
tgagatgtta 
ttttttacgt 
aaaagtacat 
agccttttta 

ggggcatttt 

aagggaaaca 
tgatcaccaa 
agaaaaacaa 
gtaacttcac 
aatcccttaa 
atcttcttga 
gctaccagcg 
tggcttcagc 
ccacttcaag 
ggctgctgcc 
ggataaggcg 



780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 



cagcggtcgg 
accgaactga 
aaggcggaca 
ccagggggaa 
cgtcgatttt 
gcctttttac 
atggccagat 
ccactcccta 



gctgaacggg 
gatacctaca 
ggtatccggt 
acgcctggta 
tgtgatgctc 
ggttcctggc 
gattaattcc 
tcagtgatag 



gggttcgtgc 
gcgtgagcta 
aagcggcagg 
tctttatagt 
gtcagggggg 
cttttgctgg 
taatttttgt 
agaaaagtga 



acacagccca 
tgagaaagcg 
gtcggaacag 
cctgtcgggt 
cggagcctat 
ccttttgctc 
tgacactcta 
aatgaatagt 



gcttggagcg 
ccacgcttcc 
gagagcgcac 
ttcgccacct 
ggaaaaacgc 
acatgacccg 
tcattgatag 
tcgacaaaaa 



aacgacctac 4560 

cgaagggaga 4620 

gagggagctt 4 680 

ctgacttgag 4740 

cagcaacgcg 4800 

acaccatcga 4860 

agttatttta 4920 

t 4971 



<210> 3 

<211> 4765 

<212> DNA 

<213> ktinstliche Sequenz 
<220> 

<221> PCN1/GFP24 Klonierungs- und Expressionsvektor 

<400> 3 



g 



^ctagataaga 
[ttttctggc 
'bgccgcgacg 
attatcaaca 
tgtcgacaca 
ttgagtttgt 
acaccatgct 
ttcttgttga 
aaggtgatgc 
ctgttccatg 
atccggatca 
aggaacgcac 
ttgaaggtga 
gaaacattct 
cagacaaaca 
cggcctcggg 
atgcttgcgg 
ccgctctgca 
tggctgctca 
gaaataccta 
ggcaagcatc 
cagaactcc 
gcagaaagtt 
tgattttgat 
tgaaaacgcg 
tgctgctatc 
tggtgatttt 
tttaatgaat 
ttatgtcttt 
attccgtggt 
gtttgctaac 
ggcgcacatt 
cacgcgccct 
gctacacttg 
acgttcgccg 
agtgctttac 
ccatcgccct 
ggactcttgt 
taagggattt 
aacgcgcatg 
cctatttgtt 
tgataaatgc 
accaccgttg 



aggaagaaaa 
acaactcggc 
tgcgactgcg 
aaatactcca 
atctgccctt 
aactgctgct 
gggtggtggt 
attagatggt 
aacatacgga 
gccaacactt 
tatgaaacgg 
tatatctttc 
tacccttgtt 
cggacacaaa 
aaagaatgga 
ggccgcagaa 
tggcaccgac 
gactgaaatc 
cggcggttgt 
ttgcctacgg 
tgcggtggcc 
gaactggctt 
atgaaccacg 
tatgaaaaaa 
ctacagtctg 
gatggtttca 
gctggctcta 
aatttccgtc 
ggcgctggta 
gtctttgcgt 
atactgcgta 
gtgcgacatt 
gtagcggcgc 
ccagcgccct 
gctttccccg 
ggcacctcga 
gatagacggt 
tccaaactgg 
tgccgatttc 
caacgcttac 
tatttttcta 
ttcaataata 
atatatccca 



ataatgaaca 
ggcttaaccg 
gcccagccgg 
attggcgatg 
tcgaaagatc 
gggatttccg 
ggtagtaaag 
gatgttaatg 
aaacttaccc 
gtcactactt 
catgactttt 
aaagatgacg 
aatcgtatcg 
ctcgagtaca 
atcaaagcta 
caaaaactca 
accctgcaag 
gctaacctgc 
gggctaggct 
cagccgctgg 
gtatcgctcg 
ccaccgctaa 
gcggttgtgg 
tggcaaacgc 
acgctaaagg 
ttggtgacgt 
attcccaaat 
aatatttacc 
aaccatatga 
ttcttttata 
ataaggagtc 
ttttttgtct 
attaagcgcg 
agcgcccgct 
tcaagctcta 
ccccaaaaaa 
ttttcgccct 
aacaacactc 
ggcctattgg 
aatttcaggt 
aatacattca 
ttgaaaaagg 
atggcatcgt 



ataacgatct 
tcgccgggat 
ccatggcggg 
gccctgtcct 
ccaacgaaaa 
gtggtggtgg 
gagaagaact 
ggcacaaatt 
ttaaatttat 
tctcttatgg 
tcaagagtgc 
ggaactacaa 
agttaaaagg 
actataactc 
acttcaaaat 
tctcagaaga 
ctgaaaccga 
tgaaagagaa 
aataacttaa 
attgttatta 
tctggaagaa 
catgctgcgt 
tggcggttcc 
taataagggg 
caaacttgat 
ttccggcctt 
ggctcaagtc 
ttctttgcct 
attttctatt 
tgttgccacc 
ttaataagct 
gccgtttacc 
gcgggtgtgg 
cctttcgctt 
aatcgggggc 
cttgattagg 
ttgacgttgg 
aaccctatct 
ttaaaaaatg 
ggcacttttc 
aatatgtatc 
aagagtatgg 
aaagaacatt 



ctttcaggca 
gctggggccg 
atccgttcaa 
tttaccagac 
gcgtgaccac 
tgctaccccg 
tttcactgga 
ttctgtcagt 
ttgcactact 
tgttcaatgc 
catgcccgaa 
gacgcgtgct 
tattgatttt 
acacaatgta 
tcgccacaac 
gaatctgtat 
ccagctggaa 
agagaaactg 
gccaaggagg 
ctcgcggcac 
aaagttaaaa 
gaacaggttg 
ctagcgggct 
gctatgaccg 
tctgtcgcta 
gctaatggta 
ggtgacggtg 
cagtcggttg 
gattgtgaca 
tttatgtatg 
tgacctgtga 
gctactgcgt 
tggttacgcg 
tcttcccttc 
tccctttagg 
gtgatggttc 
agtccacgtt 
cggtctattc 
agctgattta 
ggggaaatgt 
cgctcatgag 
agaaaaaaat 
ttgaggcatt 



tcacgtcggc 
tcattgttaa 
ctagcagacc 
aaccattacc 
atggtccttc 
caggacctga 
gttgtcccaa 
ggagagggtg 
ggaaaactac 
ttttcccgtt 
ggttatgtac 
gaagtcaagt 
aaagaagatg 
tacatcacgg 
attgaagatt 
ttccagggcg 
gacgagaaat 
gaattcattc 
aaaataaaat 
agccggccat 
ccctgaaagc 
ctcagctgaa 
ccggttccgg 
aaaatgccga 
ctgattacgg 
atggtgctac 
ataattcacc 
aatgtcgccc 
aaataaactt 
tattttcgac 
agtgaaaaat 
cacggatctc 
cagcgtgacc 
ctttctcgcc 
gttccgattt 
acgtagtggg 
ctttaatagt 
ttttgattta 
acaaaaattt 
gcgcggaacc 
acaataaccc 
cactggatat 
tcagtcagtt 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 



I 




mmilH tllToT^Tt littlllTal tllT.^^^^ cggccttttt aaagaccgta 2640 
gctcatccgg aat?cJg?a^ ggcaata!aa aa^f ttcttgcccg cctgatgaat 2700 

cacccttg?? acaccgj^tt cca^gagcaa IctaaaacJt ggatagtgtt 2760 

taccacgacg atttccggca gtttcXcac Itlf^tt^ tttcatcgct ctggagtgaa 2820 
gaaaacctgj cctatt?ccc ?aaaggg?tt attgagaa?a tlttlll^^t 2880 
ccctgggtga gtttcaccag ttttga^tta aacataS^ ^^^^ ctcagccaat 2940 

cccgttttca ctatgggcaa atattatac« atatggacaa cttcttcgcc 3000 

attcaggttc atca?gccgt t^Saa^aac ttllttK''^ aggtgctgat gccgctggcg 3060 
caacagtact gcaataaata lltlt^^^ ttccatgtcg gcagaatgct taatgaatta 3120 
gataaLg?a SSgS?aa UgllUlll lltToltt' -ttaatgat gtctcgttta 3180 
ttaacaaccc gtaaactcgc ccaaaaoctJ nnf^t^ atgaggtcgg aatcgaaggt 3240 

gtaaaaaata agcgggct?t gctcaacacc ^^^f^^^^t gtattggcat 3300 

actcactttt gccctttaaa lllllt^^ "^^^^^^tg agatgttaga taggcaccat 3360 
agttttagat gtgc^^tac? lllllttT. ^![^°"5^tt ttttacgtaa taacgctaaa 3420 
cctacagLa aacag^a^ga aaSctcgl^ llllTJTa ""fltT^^ ^ggtacacgg 3480 
ttttcactag agaatgcatt atatar^^^^ cctttttatg ccaacaaggt 3540 

gtattggaa^ aLaag^gca tollTtTgTt lllltlllll ^^^f tttaggttgc 3600 
agtatgccgc cattattacg acaagctSc aaa??a???a tactactgat 3660 

gccttcttat tcggccttga attgltcata ?ar^^=f^^ atcaccaagg tgcagagcca 3720 

Iagtgggtctt aalagcagca ?aacStS? ccg?S^aa? Tr-tt^'^T H^^^'^^^-- 3780 
jfttgccgccg ggcgtttttt aatattJfo; ^f! ? H?^ aacttcacta ttaacgctcg 3840 
&ctttt?ga? Iltctcatga ccaaaa^ccc Itt f fff^^^^^^* aggtgaagat 3900 
agaccccjta gaaaa^tca alggltTttl t^SaKcc? tltltfl'''' actgagcgtc 3960 
ctgcttgcaa acaaaaaaac caccgctacc agS?SS ^^J^J ^^"^ gcgtaatctg 4020 
accaactctt tttccgaagg taactaac?? Itnntl^^ tgtttgccgg atcaagagct 4080 
tctagtgtag ccgtagttfg gccaccfctJ caaSac^c? ^^^^^^ atactgtcct 4140 

cgctctgcta atcctottac l^ai-r,r,t^ll caagaactct gtagcaccgc ctacatacct 4200 
gttggactca agacgSagt taccgaa^Ia aacaJK^^° gataagtcgt gtcttaccgg 4260 
gtgcacacag cccagct^gg agcaalcaao ^?°^°^9cgg tcgggctgaa cggggggttc 4320 
gctatgagaa agcgccacgc Scccaafaa alatt'''"'^^ ctgagatacc tacagcgtga 4380 
cagggtcgga aca^gagagc gcacgfqaaa TJtr.t'''"^ gacaggtatc cggtaagcgg 4440 
tagtcctgtc ggg??tcgcc llltltnt.t ^'^^^^^fa^rg ggaaacgcct ggtatcttta 4500 
ggggcggfgc c?a"galaa acgccagcaa cacaaS^?^ "tttgtgat gctcgtcagg 4560 
ctggcctttt gctcacat^a nn^^ cgcggccttt ttacggttcc tggccttttg 4620 

ttj?tgac;c ?ctatcSg atalaattat "^^^^ ^^^^^^^taa ttcctaatt? 4 680 

gtgaaatgaa tagttcgaca aaaft *ttacoactc cctatcagtg atagagaaaa 4740 
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S?ggg?gcl ^ga^M^^^t^ llTollllt Sa'?S^^^^ gtaaaagatg ctgaagatca 60 
ttttcgcccc gaagalcgtt SccaSaS agcggtaaga tccttgagag 120 

ggtattatcc cg?K?Scg ccaaae!!^^ gagcactttt aaagttctgc tatgtggcgc 280 
laatgacttg StgagSc? claHlt^tr, ^^^^^^cggt cgccgcatac actattctL 240 
LgagaattI ?gcag?gctg ccatalccat TataT^'' cttacggatg gcatgacagt 300 
gacaacgatc ggaggaccga aggagcSac cgS?Stta cacl!?!^^ acttacttct 360 
aactcgcctt gatcgttggg aaccoaaoct an^^;:!^ cacaacatgg gggatcatgt 420 
caccacgatg cctgtaacaa tooof™ gaatgaagcc ataccaaacg acgagcgtga 480 
tactctagc? tcclggcaac aKtaataa! gttgcgcaaa ctattaactg gcgaac?act 540 
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gataggtgcc tcactgatta agcattggtc ggcctcgggg gcc 
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